テキストデータの統計科学入門

書誌事項

テキストデータの統計科学入門

金明哲著

岩波書店, 2009.4

タイトル読み

テキスト データ ノ トウケイ カガク ニュウモン

大学図書館所蔵 件 / 372

この図書・雑誌をさがす

注記

参考文献: p235-239

内容説明・目次

内容説明

ウェブや電子メールに代表されるように、テキストデータが大量に流通、蓄積されるようになった。文字列で記述されたデータの山から情報や知識を探し出すテキストマイニングの手法がさまざまな分野で必要になってきている。テキスト化された顧客の声から新たなニーズを抽出したり、迷惑メールを自動判別するなど、実用的な場面ですでに多くの活用がなされている。また、学術的な場面でも計量言語学やゲノム解析といった分野を中心に、強力な研究手段となっている。このように幅広い分野で共通に用いられる統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いた実践で身につけるのが本書の目的である。統計的テキストデータ解析に焦点を絞り、初歩的な統計学の解説からはじめて、近年提案されたデータマイニング手法まで紹介している。そのおもな内容は文系・理系を問わず理解できるだろう。

目次

  • 統計的テキストマイニング
  • テキストのクリーニングと関連ツール
  • 形態素解析と構文解析
  • テキストにおける集計モデルと集計ツール
  • テキストにおける統計法則と指標
  • テキストにおけるネットワーク分析
  • テキストの探索的分析
  • テキストにおける確率モデリング
  • テキストと情報量
  • テキストにおける推測分析
  • テキストにおける差異の分析と特徴抽出
  • テキストの特徴と話題分析
  • テキストのクラスター分析
  • テキストの分類
  • テキストの時系列分析
  • アソシエイション分析と意味処理

「BOOKデータベース」 より

詳細情報

  • NII書誌ID(NCID)
    BA89891753
  • ISBN
    • 9784000057028
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 出版地
    東京
  • ページ数/冊数
    xiv, 244p
  • 大きさ
    21cm
  • 分類
  • 件名
ページトップへ