統計的データクリーニングの理論と実践 : Rによるデータ編集/欠測補完システム

書誌事項

統計的データクリーニングの理論と実践 : Rによるデータ編集/欠測補完システム

Mark van der Loo, Edwin de Jonge著 ; 地道正行 [ほか] 訳

共立出版, 2022.2

タイトル別名

Statistical data cleaning with applications in R

統計的データクリーニングの理論と実践 : Rによるデータ編集欠測補完システム

タイトル読み

トウケイテキ データ クリーニング ノ リロン ト ジッセン : R ニ ヨル データ ヘンシュウ/ケッソク ホカン システム

大学図書館所蔵 件 / 129

この図書・雑誌をさがす

注記

その他の訳者: 高橋雅夫, 藤野友和, 安川武彦, 和田かず美

訳者「高橋」の「高」は「梯子高 (はしごだか) 」の置き換え

原著 (Wiley, c2018) の翻訳

参考文献: p327-339

内容説明・目次

内容説明

本書は、数値データやカテゴリデータ、文字列や日付といった様々なタイプのデータを含むファイルをクリーンにするために、公的統計の分野で長年培われてきた技術と理論を幅広くまとめ、汎用的なデータクリーニングシステムをRで構築する方法を紹介する書籍です。Rにおけるデータ表現やデータ構造に関連する技術面についても詳しく解説するとともに、個別のデータ項目に関する知識に基づくルールを用いて統計的にデータを検証し、複数の項目が絡むエラーがある場合に修正すべき最小限の項目を特定し、修正あるいは欠測の補完を行うための様々な方法論も説明しています。

目次

  • 第1章 データクリーニング
  • 第2章 R入門
  • 第3章 データの技術的な表現
  • 第4章 データ構造
  • 第5章 テキストデータのクリーニング
  • 第6章 データ検証
  • 第7章 データレコード内のエラー局所化
  • 第8章 ルール集合のメンテナンスと単純化
  • 第9章 ドメイン知識のためのモデルベースの方法
  • 第10章 補完と調整
  • 第11章 事例:小規模なデータクリーニングシステム

「BOOKデータベース」 より

詳細情報

ページトップへ