Warehouse

1.教育用標準データ(2019/12/09)

1)配布データの説明

独立行政法人統計センターは、我が国の中央統計機関の一翼を担う独立行政法人です。
統計センターのホームページでは、「教育用標準データセット」を提供しています。
全国1,741市区町村のデータを統計の学習や学校教育に活用する目的で作成したようです。
ここでは、2018年9月5日時点の解説及びデータを活用することにします。
但し、本ブログで活用するために、補足情報を追加しデータを分割することで、都道府県や市区町村を区分別に分析できるようにしています。
本ブログの配布データは、以下の「ダウンロード」ボタンによりダウンロードしてください。

教育用標準データセット(本ブログ版) 
(ssdse.zip)

2)データの解説

本データは、ssdse(Standardized Statistical Data Set for Education)と略します。
ダウンロードしたファイルは、zipで圧縮されていますので解凍して使用してください。
解凍された中に含まれる「SSDSE2018_kaisetsu.pdf」は、元の「教育用標準データセット」に対する2018年9月5日時点の解説です。

3)教育用標準データセット

ここで提供するデータファイルは、全てcsvファイル(Comma Separated Values:カンマ区切りのファイル)になります。
また、本csvファイルには、ヘッダーが1行目についていますが、ヘッダーには各項目の変数名が指定されています。また、解凍されたファイルに含まれる「v_label.csv」には、ここで使用する変数名に対応する日本語の名称が示されています。但し、都道府県や市区町村等を示す以外のデータ内容の変数名は、元の「教育用標準データセット」に使用されている変数名と一致していますので、「SSDSE2018_kaisetsu.pdf」を見ていただいた方が詳細が分かります。
本ブログでは、元のデータを以下の様に分割しています。
 「8division.csv」:8地方区分の情報
 「prefecture.csv」:都道府県の情報
 「municipality.csv」:市区町村の情報
 「mtype.csv」:市区町村タイプの情報
 「ssdse.csv」:ssdseのデータ(教育用標準データセット)