機械学習のための特徴量エンジニアリング : その原理とPythonによる実践

書誌事項

機械学習のための特徴量エンジニアリング : その原理とPythonによる実践

Alice Zheng, Amanda Casari著 ; ホクソエム訳

オライリー・ジャパン , オーム社 (発売), 2019.2

タイトル別名

Feature engineering for machine learning : principles and techniques for data scientists

機械学習のための特徴量エンジニアリング : その原理とPythonによる実践

タイトル読み

キカイ ガクシュウ ノ タメ ノ トクチョウリョウ エンジニアリング : ソノ ゲンリ ト Python ニヨル ジッセン

大学図書館所蔵 件 / 178

注記

原著 (O'Reilly Media, c2018) の翻訳

参考文献: 章末

索引: p193-199

内容説明・目次

内容説明

本書は、機械学習モデルの性能を向上させるために、データから良い特徴量を作る特徴量エンジニアリングについて解説します。前半では初学者に向けて、数値、テキスト、カテゴリ変数の基本的な取り扱い方を説明し、後半では特徴量ハッシング、ビンカウンティング、PCAによるデータの圧縮、さらに非線形特徴量とモデルスタッキング、画像特徴量抽出と深層学習による自動特徴学習などの高度なテーマを扱います。特徴量エンジニアリングの原理について直感的な理解が得られるように図や例を豊富に使い、またPythonコードによる実行例を数多くあげて解説しており、実際の業務に適用するための具体的な知識が得られます。特徴量エンジニアリングを使いこなし、機械学習モデルの性能を最大限に引き出したいエンジニア必携の一冊です。Kaggle GrandmasterのKohei Ozaki(@smly)氏による「日本語版に寄せて」を収録しています。

目次

  • 1章 機械学習パイプライン
  • 2章 数値データの取り扱い
  • 3章 テキストデータの取り扱い
  • 4章 特徴量スケーリングによる効果:Bag‐of‐WordsのTF‐IDFによる重み付け
  • 5章 カテゴリ変数の取り扱い
  • 6章 次元削減:膨大なデータをPCAで圧縮
  • 7章 非線形特徴量の生成:κ‐meansを使ったスタッキング
  • 8章 特徴量作成の自動化:画像特徴量の抽出と深層学習
  • 9章 バック・トゥ・ザ・「フィーチャー」:学術論文レコメンドアルゴリズムの構築
  • 付録A 線形モデリングと線形代数の基礎

「BOOKデータベース」 より

詳細情報

ページトップへ