SREサイトリライアビリティエンジニアリング : Googleの信頼性を支えるエンジニアリングチーム
Author(s)
Bibliographic Information
SREサイトリライアビリティエンジニアリング : Googleの信頼性を支えるエンジニアリングチーム
オライリー・ジャパン , オーム社 (発売), 2017.8
- Other Title
-
Site reliability engineering : how Google runs production systems
- Title Transcription
-
SRE サイト リライアビリティ エンジニアリング : Google ノ シンライセイ オ ササエル エンジニアリング チーム
Available at / 73 libraries
-
No Libraries matched.
- Remove all filters.
Search this Book/Journal
Note
その他の編者: Chris Jones, Jennifer Petoff, Niall Richard Murphy
監訳: 澤田武男, 関根達夫, 細川一茂, 矢吹大輔
参考文献: p519-533
索引あり
Description and Table of Contents
Description
サイトリライアビリティエンジニアリング(SRE)とは、Googleで培われたシステム管理とサービス運用の方法論です。GoogleのSREチームの主要メンバーによって書かれた本書は、ソフトウェアのライフサイクル全体にコミットすることで世界最大規模のソフトウェアシステムがどのように構築、導入、監視、維持されているのかを解説します。はじめにリスク管理やサービスレベル目標、リリースエンジニアリングなどSREの行動の基礎となる原則について解説し、次にインシデント管理や障害の根本原因分析、SRE内でのソフトウェア開発など大規模分散コンピューティングシステムを構築し運用するSREの実践について詳述します。さらにSREのトレーニングやコミュニケーションなどの管理について紹介します。急速にスケールするサービスを高い信頼性で運用する方法を解説する本書はエンジニア必携の一冊です。
Table of Contents
- 第1部 イントロダクション(イントロダクション;SREの観点から見たGoogleのプロダクション環境)
- 第2部 原則(リスクの受容;サービスレベル目標 ほか)
- 第3部 実践(時系列データからの実践的なアラート;オンコール対応 ほか)
- 第4部 管理(SREの成長を加速する方法:新人からオンコール担当、そしてその先へ;割り込みへの対処 ほか)
- 第5部 まとめ(他の業界からの教訓;まとめ)
- 付録
by "BOOK database"