SREサイトリライアビリティエンジニアリング : Googleの信頼性を支えるエンジニアリングチーム

Author(s)

Bibliographic Information

SREサイトリライアビリティエンジニアリング : Googleの信頼性を支えるエンジニアリングチーム

Betsy Beyer [ほか] 編 ; 玉川竜司訳

オライリー・ジャパン , オーム社 (発売), 2017.8

Other Title

Site reliability engineering : how Google runs production systems

Title Transcription

SRE サイト リライアビリティ エンジニアリング : Google ノ シンライセイ オ ササエル エンジニアリング チーム

Available at  / 73 libraries

Note

その他の編者: Chris Jones, Jennifer Petoff, Niall Richard Murphy

監訳: 澤田武男, 関根達夫, 細川一茂, 矢吹大輔

参考文献: p519-533

索引あり

Description and Table of Contents

Description

サイトリライアビリティエンジニアリング(SRE)とは、Googleで培われたシステム管理とサービス運用の方法論です。GoogleのSREチームの主要メンバーによって書かれた本書は、ソフトウェアのライフサイクル全体にコミットすることで世界最大規模のソフトウェアシステムがどのように構築、導入、監視、維持されているのかを解説します。はじめにリスク管理やサービスレベル目標、リリースエンジニアリングなどSREの行動の基礎となる原則について解説し、次にインシデント管理や障害の根本原因分析、SRE内でのソフトウェア開発など大規模分散コンピューティングシステムを構築し運用するSREの実践について詳述します。さらにSREのトレーニングやコミュニケーションなどの管理について紹介します。急速にスケールするサービスを高い信頼性で運用する方法を解説する本書はエンジニア必携の一冊です。

Table of Contents

  • 第1部 イントロダクション(イントロダクション;SREの観点から見たGoogleのプロダクション環境)
  • 第2部 原則(リスクの受容;サービスレベル目標 ほか)
  • 第3部 実践(時系列データからの実践的なアラート;オンコール対応 ほか)
  • 第4部 管理(SREの成長を加速する方法:新人からオンコール担当、そしてその先へ;割り込みへの対処 ほか)
  • 第5部 まとめ(他の業界からの教訓;まとめ)
  • 付録

by "BOOK database"

Details

  • NCID
    BB24346984
  • ISBN
    • 9784873117911
  • Country Code
    ja
  • Title Language Code
    jpn
  • Text Language Code
    jpn
  • Original Language Code
    eng
  • Place of Publication
    東京,東京
  • Pages/Volumes
    xxxix, 547p
  • Size
    24cm
  • Classification
  • Subject Headings
Page Top