Chaos Engineering(カオスエンジニアリング)とは
calendar_month2020-04-01 公開 update2020-05-19 更新
正常稼働中の本番システム上で、あえて障害を発生させて、自動回復システムの動作を確認し、より高いレジリエンス(障害からの復旧力)を持つシステムを構築するための手法。
特に、多数のコンポーネントからなる分散型システム、マイクロサービスを採用したシステムでは、1つのコンポーネントに障害が発生したとき、周囲のコンポーネントにどのような影響を与えるのかを事前に予測するのが困難である。
そのため、制御できる範囲の障害を意図的に発生させて挙動を観察し、その結果を踏まえることで、より安定的なシステムを構築することができるという考え方に基づいている。
Netflix が、Amazon AWS 内で本番稼働中の自社サービスに対し実践し、その概要を公開したことで話題となる。
現在では、Facebook、Amazon、Google などの Web 関連企業のほか、欧米の金融業界、日本では cookpad が導入宣言するなど徐々に広がっている。
label 関連するタグ
教育研修担当 (トレーニング担当者) のためのWebマガジンを編集しています。
-
- 「こんな特集、記事を読んでみたい」というリクエスト
- 「こんな記事を書いてみたい」という執筆者の方のお問い合わせ
や誤植のご連絡など、お問い合わせフォームより受付しています。
お気軽に問い合わせくださいませ!!
contacts トレタン お問い合わせフォーム