Chaos Engineering：意図的にシステムを壊して強くする¶

定常状態の定義: 正常時のメトリクス基準値を決める
仮説設定: 「〇〇が壊れてもシステムは動き続ける」
障害注入: 最小スコープから（まずステージング）
観察: メトリクス・ログ・アラートで影響確認
改善: 仮説が外れた箇所を修正

要約¶

Chaos Engineering は障害を意図的に注入してシステムの耐性を検証する手法。通常のテストが「正常動作するか」を問うのに対し、「障害時に何が起きるか」を問う。Netflix の Chaos Monkey が起源。