パターンでわかるHadoop MapReduce : ビッグデータのデータ処理入門

Author(s)

    • 三木, 大知 ミキ, ダイチ

Bibliographic Information

パターンでわかるHadoop MapReduce : ビッグデータのデータ処理入門

三木大知著

(Next one)

翔泳社, 2012.8

Title Transcription

パターン デ ワカル Hadoop MapReduce : ビッグ データ ノ データ ショリ ニュウモン

Available at  / 52 libraries

Description and Table of Contents

Description

分散クラスタシステムHadoopは、MapReduceという枠組みを利用して処理を行う。MapReduceはさまざまな分散処理を単純な処理の組み合わせで解決できるHadoopの特徴のひとつである。本書ではHadoopでできるデータ処理をシンプルに解説。「理解しにくい」といわれるMapReduce処理を13の単純なパターンで紹介し、それらを使って「株価分析」「ログ解析」「ワードカウント」から簡単な「クラスタ分析」までを試す。ロジックはJavaに基づく簡易コードを使うほか、手続き型処理系「Pig」を使って説明。自分がHadoopに処理させたいことを実現するための考え方を紹介する。

Table of Contents

  • ビッグデータとデータの活用
  • Hadoopのエコシステム—Hadoopとオープンソースプロダクト
  • データを分散するって、どういうこと?—分散ファイルシステム
  • ばらばらか、まとめるか、それが問題だ—MapReduceの基本概念
  • 並列処理はパターンで覚えよう—基本的な13の処理パターン
  • とにかく動かしてみよう!—株価チャートの処理
  • 単語を数えるだけでも見えてくる?—テキストの解析
  • 構造がないなら意味を与えればいいじゃない?—アクセスログの分析
  • データとデータをくっつける!—鉄道情報の分析
  • 簡単な分析をしてみよう—クラスタ分析
  • Hadoopべからず集
  • 付録 簡易環境の構築/リファレンス

by "BOOK database"

Related Books: 1-1 of 1

Details

  • NCID
    BB10208053
  • ISBN
    • 9784798128061
  • Country Code
    ja
  • Title Language Code
    jpn
  • Text Language Code
    jpn
  • Place of Publication
    東京
  • Pages/Volumes
    viii, 351p
  • Size
    23cm
  • Classification
  • Subject Headings
  • Parent Bibliography ID
Page Top