入門PySpark : PythonとJupyterで活用するSpark2エコシステム

著者

書誌事項

入門PySpark : PythonとJupyterで活用するSpark2エコシステム

トマズ・ドラバス, デニー・リー著 ; 玉川竜司訳

オライリー・ジャパン , オーム社 (発売), 2017.11

タイトル別名

Learning PySpark : build data-intensive applications locally and deploy at scale using the combined powers of Python and Spark 2.0

タイトル読み

ニュウモン PySpark : Python ト Jupyter デ カツヨウ スル Spark2 エコシステム

大学図書館所蔵 件 / 71

この図書・雑誌をさがす

注記

参考文献: p295

内容説明・目次

内容説明

PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。

目次

  • 1章 Sparkを理解する
  • 2章 耐障害性分散データセット
  • 3章 DataFrame
  • 4章 データのモデリングの準備
  • 5章 MLlib
  • 6章 MLパッケージ
  • 7章 GraphFrames
  • 8章 TensorFrames
  • 9章 Blazeによるポリグロットパーシステンス
  • 10章 Structured Streaming
  • 11章 Sparkアプリケーションのパッケージ化

「BOOKデータベース」 より

詳細情報

  • NII書誌ID(NCID)
    BB2492847X
  • ISBN
    • 9784873118185
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 原本言語コード
    eng
  • 出版地
    東京,東京
  • ページ数/冊数
    xxii, 303p
  • 大きさ
    24cm
  • 分類
  • 件名
ページトップへ