Rによるテキストマイニング : tidytextを活用したデータ分析と可視化の基礎

書誌事項

Rによるテキストマイニング : tidytextを活用したデータ分析と可視化の基礎

Julia Silge, David Robinson著 ; 長尾高弘訳

オライリー・ジャパン , オーム社 (発売), 2018.5

タイトル別名

Text mining with R : a tidy approach

タイトル読み

R ニヨル テキスト マイニング : tidy text オ カツヨウ シタ データ ブンセキ ト カシカ ノ キソ

注記

原著 (O'Reilly Media, c2017) の翻訳

監訳: 大橋真也

参考文献: p203-204

索引: p205-209

内容説明・目次

内容説明

「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルかつ応用力抜群のテキストマイニング手法を提示します。

目次

  • 1章 整理テキスト形式
  • 2章 整理データを使ったセンチメント分析
  • 3章 単語の出現頻度と特定の文書での出現頻度の分析:tf‐idf
  • 4章 単語間の関係:nグラムと相関
  • 5章 未整理形式へ(から)の変換
  • 6章 トピックモデリング
  • 7章 ケーススタディ:Twitterアーカイブの比較
  • 8章 ケーススタディ:NASAメタデータのマイニング
  • 9章 ケーススタディ:Usenetテキストの分析

「BOOKデータベース」 より

詳細情報
  • NII書誌ID(NCID)
    BB26114414
  • ISBN
    • 9784873118307
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 原本言語コード
    eng
  • 出版地
    東京,東京
  • ページ数/冊数
    xvi, 209p
  • 大きさ
    21cm
  • 分類
  • 件名
ページトップへ