入門PySpark : PythonとJupyterで活用するSpark2エコシステム

Author(s)

Bibliographic Information

入門PySpark : PythonとJupyterで活用するSpark2エコシステム

トマズ・ドラバス, デニー・リー著 ; 玉川竜司訳

オライリー・ジャパン , オーム社 (発売), 2017.11

Other Title

Learning PySpark : build data-intensive applications locally and deploy at scale using the combined powers of Python and Spark 2.0

Title Transcription

ニュウモン PySpark : Python ト Jupyter デ カツヨウ スル Spark2 エコシステム

Available at  / 71 libraries

Note

参考文献: p295

Description and Table of Contents

Description

PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。

Table of Contents

  • 1章 Sparkを理解する
  • 2章 耐障害性分散データセット
  • 3章 DataFrame
  • 4章 データのモデリングの準備
  • 5章 MLlib
  • 6章 MLパッケージ
  • 7章 GraphFrames
  • 8章 TensorFrames
  • 9章 Blazeによるポリグロットパーシステンス
  • 10章 Structured Streaming
  • 11章 Sparkアプリケーションのパッケージ化

by "BOOK database"

Details

  • NCID
    BB2492847X
  • ISBN
    • 9784873118185
  • Country Code
    ja
  • Title Language Code
    jpn
  • Text Language Code
    jpn
  • Original Language Code
    eng
  • Place of Publication
    東京,東京
  • Pages/Volumes
    xxii, 303p
  • Size
    24cm
  • Classification
  • Subject Headings
Page Top