Rによるテキストマイニング : tidytextを活用したデータ分析と可視化の基礎

Bibliographic Information

Rによるテキストマイニング : tidytextを活用したデータ分析と可視化の基礎

Julia Silge, David Robinson著 ; 長尾高弘訳

オライリー・ジャパン , オーム社 (発売), 2018.5

Other Title

Text mining with R : a tidy approach

Title Transcription

R ニヨル テキスト マイニング : tidy text オ カツヨウ シタ データ ブンセキ ト カシカ ノ キソ

Available at  / 181 libraries

Note

原著 (O'Reilly Media, c2017) の翻訳

監訳: 大橋真也

参考文献: p203-204

索引: p205-209

Description and Table of Contents

Description

「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルかつ応用力抜群のテキストマイニング手法を提示します。

Table of Contents

  • 1章 整理テキスト形式
  • 2章 整理データを使ったセンチメント分析
  • 3章 単語の出現頻度と特定の文書での出現頻度の分析:tf‐idf
  • 4章 単語間の関係:nグラムと相関
  • 5章 未整理形式へ(から)の変換
  • 6章 トピックモデリング
  • 7章 ケーススタディ:Twitterアーカイブの比較
  • 8章 ケーススタディ:NASAメタデータのマイニング
  • 9章 ケーススタディ:Usenetテキストの分析

by "BOOK database"

Details

  • NCID
    BB26114414
  • ISBN
    • 9784873118307
  • Country Code
    ja
  • Title Language Code
    jpn
  • Text Language Code
    jpn
  • Original Language Code
    eng
  • Place of Publication
    東京,東京
  • Pages/Volumes
    xvi, 209p
  • Size
    21cm
  • Classification
  • Subject Headings
Page Top