抄録
本論文で,我々はネットワークデータを用いた分散システムの異常検出システムを提案する.その中で我々は,(1)対象とするシステムに負荷をかけることなく,ネットワークを流れるデータからトランザクションの情報を復元する枠組み,(2)分散したサービスの間の動的な依存関係をトランザクションの実行時間の包含関係を手掛りに,オンラインEMアルゴリズムに基づいて直接的な依存関係を発見することのできる競合モデル,及び,(3)発見された依存関係情報に基づいた様々な粒度での指標を用いた階層的な異常検出の枠組みを提案する.また,プロトタイプシステムを用いた実験によって,我々の提案するシステムが,実際にシステムに仕組まれた障害を発見できることを確認する.