Sparkによる実践データ解析 : 大規模データのための機械学習事例集

書誌事項

Sparkによる実践データ解析 : 大規模データのための機械学習事例集

Sandy Ryza [ほか] 著 ; 玉川竜司訳

オライリー・ジャパン , オーム社 (発売), 2016.1

タイトル別名

Advanced analytics with Spark

タイトル読み

Spark ニヨル ジッセン データ カイセキ : ダイキボ データ ノ タメ ノ キカイ ガクシュウ ジレイシュウ

大学図書館所蔵 件 / 97

この図書・雑誌をさがす

注記

その他の著者: Uri Laserson, Sean Owen, Josh Wills

監訳: 石川有

内容説明・目次

内容説明

本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。

目次

  • ビッグデータの分析
  • ScalaとSparkによるデータ分析の紹介
  • 音楽のレコメンドとAudioscrobblerデータセット
  • 決定木を使った森林被覆の予測
  • K平均クラスタリングを使ったネットワークトラフィックにおける異常の検出
  • 潜在意味解析を使ったWikipediaの理解
  • GraphXを使った共起ネットワークの分析
  • ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析
  • モンテカルロシミュレーションによる金融リスクの推定
  • ゲノムデータの分析とBDGプロジェクト
  • PySparkとThunderを使った神経画像データの分析
  • Sparkの詳細
  • MLlib Pipelines API
  • SparkRについて
  • SparkのJVM、OSレベルのチューニングによる高速化

「BOOKデータベース」 より

詳細情報

  • NII書誌ID(NCID)
    BB20471645
  • ISBN
    • 9784873117508
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 原本言語コード
    eng
  • 出版地
    東京,東京
  • ページ数/冊数
    xviii, 309p
  • 大きさ
    24cm
  • 分類
  • 件名
ページトップへ