2000年合衆国センサスデータ抽出ツールの開発とMANDARAでの地図化

DOI

書誌事項

タイトル別名
  • Development of data extracting tools for US 2000 Census and mapping using MANDARA

抄録

1.はじめに<BR>  本研究では,詳細な統計データファイルと地図データを無償で提供しており,また需要も多いと考えられる,アメリカ合衆国の2000年センサスから,ユーザーの必要なデータを抽出するツールを開発し,筆者が開発しているGISのMANDARAを使って地図化する。<BR> <BR> 2.2000年合衆国センサスとCTPP2000<BR>  合衆国センサスでは,short formと呼ばれる全数調査と,long formと呼ばれる1/6サンプルの調査が行われている。short formでは性別,年齢,人種,世帯・家族・住宅所有など8項目を尋ねているだけで,かなりシンプルである。long formでは,short formの項目に加え,学歴,職業,通勤,年収,住宅の築年など,53項目にわたる詳細な内容を尋ねている(ただし,2010年センサスではlong formの調査は行われない予定である)。<BR>  このデータは多様な空間単位で集計されている。国-州-カウンティ-センサストラクト-ブロックグループ-プロックという系統が中心にあり,それ以外にもCity, Town,都市圏など多数の集計単位が存在する。<BR>  データの閲覧には,合衆国センサス局のホームページ(http://www.census.gov/)からAmerican FactFinderを使うことができ,WebGISの機能も有していて地図化することも可能である。しかしながら,センサス局のホームページからは元のデータファイル自体をダウンロードすることができる。このデータファイルを直接操作することで,任意の集計単位で広範囲のデータを抽出することができる。データファイルはSummary Filesと呼ばれる次の4つに分けられる。<BR> Summary File 1: short formに関係する286の表が含まれている。<BR> Summary File 2: 249の人口集団ごとにshort form に関係する47の表が含まれている。<BR> Summary File 3: long formに関係する813の表が含まれている。<BR> Summary File 4: 336の人口集団ごとに,long formに関係する323の表が含まれている。<BR>  それぞれのSummary File には,大量のデータが含まれていることから,ダウンロードするファイルは単一ではなく複数に分割されている。しかし必要なデータがどのファイルに含まれているかを知ることはかなり手間のかかる作業である。また,一つのファイルには一つの州内のあらゆる集計単位のデータが含まれている。さらにその集計単位は州ごと・Summary Fileごとに論理番号で管理され,論理番号に対応する実体は別にGeographical Headerファイルで管理されている。<BR>  このような複雑なデータファイルから,必要なデータを必要な集計単位で抽出することは,表計算ソフトの機能だけでは困難なので,データベースソフトを用いる必要がある。しかしより簡便な抽出ツールを開発することで,多くの人がデータを利用できるようになるだろう。<BR>  2000年センサスデータのうち,通勤流動および就業地ベースのデータは,合衆国運輸省においてCTPP(Census Transportation Planning Package)2000として整備され,運輸統計局のホームページ(http://www.bts.gov/)からダウンロードできる。このデータは州単位で集計単位を指定してダウンロードできるので,ダウンロード後の操作は比較的容易だが,地域間のODデータに関しては指定した州にかかわる全ての流動が出力されるので,必要なパターンを抽出するためのツールが必要である。<BR> <BR> 3.データ抽出ツールの開発とMANDARAでの地図化<BR>  上記のようなSummary FileとCTPPのODデータから必要なデータを抽出するツールを開発した。開発言語はVisual Basic 2005で,ツールを使用するためには,NET Framework 2.0がインストールされたWindowsパソコンが必要である。ツールは筆者のホームページ(http://www5f.biglobe.ne.jp/~ktani/)からダウンロードできる。<BR>  統計データを抽出しただけでは地図化することはできないが,センサス局ホームページからはカウンティやセンサストラクトといった各種集計単位に対応した境界データをダウンロードすることができる。データはExport(.e00) 形式とShape形式の両方が用意されている。<BR>  これらの地図データは筆者の開発しているGISのMANDARAで取り込むことができ,それぞれのオブジェクトには該当するコード番号がオブジェクト名として設定される。このコード番号は,州: 2桁,カウンティ: 3桁,センサストラクト: 4桁(2桁の拡張子を持つセンサストラクトもある)などと決められている。一方,データ抽出ツールを使って出力されるデータにも集計単位に応じたコードが付けられているので,これをキーとしてMANDARA上で両者を結合させる。<BR>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390001205593241344
  • NII論文ID
    130004596651
  • DOI
    10.11518/hgeog.2007.0.603.0
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ