爆速Python : 巨大データセットを扱うための高速化テクニック
著者
書誌事項
爆速Python : 巨大データセットを扱うための高速化テクニック
(Programmer's selection)
翔泳社, 2024.6
- タイトル別名
-
Fast Python : high performance techniques for large datasets
爆速Python (ぱいそん)
- タイトル読み
-
バクソク Python : キョダイ データ セット オ アツカウ タメ ノ コウソクカ テクニック
大学図書館所蔵 件 / 全29件
-
該当する所蔵館はありません
- すべての絞り込み条件を解除する
この図書・雑誌をさがす
注記
原著 (Manning Publications, c2023) の翻訳
内容説明・目次
内容説明
本書の目的は、Pythonエコシステムでより効率的なアプリケーションを記述する手助けをすることにあります。より効率的とは、コードが使うCPUサイクル、ストレージ領域、ネットワーク通信が少なくなることを意味します。本書では、パフォーマンスの問題に総合的なアプローチでのぞみます。ピュアPythonでのコード最適化テクニックについて説明するだけではなく、NumPyやpandasなど広く使われているデータライブラリの効率的な使い方についても検討します。Pythonでは十分なパフォーマンスが得られないケースがあるため、スピードがさらに求められる場合はCythonについても検討します。この総合的なアプローチの一環として、コードの設計にハードウェアが与える影響にも目を向け、現代のコンピュータアーキテクチャがアルゴリズムのパフォーマンスにおよぼす影響を分析します。また、ネットワークアーキテクチャが効率におよぼす影響と、高速なデータ分析でのGPUコンピューティングの使い方も調べます。
目次
- 1 基礎的なアプローチ(データ処理の効率化が急がれている;組み込み機能のパフォーマンスを最大限に引き出す;並行性、並列性、非同期処理;ハイパフォーマンスなNumPy)
- 2 ハードウェア(Cythonを使って重要なコードを再実装する;メモリ階層、ストレージ、ネットワーク)
- 3 現代のデータ処理のためのアプリケーションとライブラリ(ハイパフォーマンスなpandasとApache Arrow;ビッグデータの格納)
- 4 高度なトピック(GPUコンピューティングを使ったデータ分析;Daskを使ったビッグデータの分析)
- 付録A 環境のセットアップ
- 付録B Numbaを使って効率的な低レベルコードを生成する
「BOOKデータベース」 より