Rによるテキストマイニング : tidytextを活用したデータ分析と可視化の基礎
著者
書誌事項
Rによるテキストマイニング : tidytextを活用したデータ分析と可視化の基礎
オライリー・ジャパン , オーム社 (発売), 2018.5
- タイトル別名
-
Text mining with R : a tidy approach
- タイトル読み
-
R ニヨル テキスト マイニング : tidy text オ カツヨウ シタ データ ブンセキ ト カシカ ノ キソ
大学図書館所蔵 件 / 全181件
-
該当する所蔵館はありません
- すべての絞り込み条件を解除する
この図書・雑誌をさがす
注記
原著 (O'Reilly Media, c2017) の翻訳
監訳: 大橋真也
参考文献: p203-204
索引: p205-209
内容説明・目次
内容説明
「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルかつ応用力抜群のテキストマイニング手法を提示します。
目次
- 1章 整理テキスト形式
- 2章 整理データを使ったセンチメント分析
- 3章 単語の出現頻度と特定の文書での出現頻度の分析:tf‐idf
- 4章 単語間の関係:nグラムと相関
- 5章 未整理形式へ(から)の変換
- 6章 トピックモデリング
- 7章 ケーススタディ:Twitterアーカイブの比較
- 8章 ケーススタディ:NASAメタデータのマイニング
- 9章 ケーススタディ:Usenetテキストの分析
「BOOKデータベース」 より