入門PySpark : PythonとJupyterで活用するSpark2エコシステム
著者
書誌事項
入門PySpark : PythonとJupyterで活用するSpark2エコシステム
オライリー・ジャパン , オーム社 (発売), 2017.11
- タイトル別名
-
Learning PySpark : build data-intensive applications locally and deploy at scale using the combined powers of Python and Spark 2.0
- タイトル読み
-
ニュウモン PySpark : Python ト Jupyter デ カツヨウ スル Spark2 エコシステム
大学図書館所蔵 件 / 全71件
-
該当する所蔵館はありません
- すべての絞り込み条件を解除する
この図書・雑誌をさがす
注記
参考文献: p295
内容説明・目次
内容説明
PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。
目次
- 1章 Sparkを理解する
- 2章 耐障害性分散データセット
- 3章 DataFrame
- 4章 データのモデリングの準備
- 5章 MLlib
- 6章 MLパッケージ
- 7章 GraphFrames
- 8章 TensorFrames
- 9章 Blazeによるポリグロットパーシステンス
- 10章 Structured Streaming
- 11章 Sparkアプリケーションのパッケージ化
「BOOKデータベース」 より

