このドキュメントは 公開ポートフォリオ用の架空事例 です。実在の障害ではありません。 重大インシデント対応プレイブック(incident-response-playbook.md)と組み合わせて、 「型 → 実例」が一通り読める形にしています。
| 項目 | 内容 |
|---|---|
| インシデントID | INC-2026-0312 |
| 重大度 | P2(業務影響あり / 全社停止には至らず) |
| 検知日時 | 2026-03-12 09:14 JST |
| 収束日時 | 2026-03-12 11:48 JST |
| 報告者 | ヘルプデスク 一次受付 |
| 対応IC | インフラ運用 担当 A |
| 影響範囲 | 共有フォルダ \\fs01\Dept-Sales を利用する営業部 32 名 |
| サービス | ファイルサーバー fs01 (Windows Server 2022) |
| 業務影響 | 提案資料の保存に最大 90 秒の遅延。提出締切前の混雑時間帯と重なり、4 件で承認フロー遅延が発生 |
朝の業務開始直後から営業部の共有フォルダで「保存が遅い」という問い合わせが集中。原因は 同部署内ユーザーが Outlook PST ファイルを共有フォルダ直下に置き、同期型バックアップエージェントがそれを毎時フルスキャンしていた ことによる I/O キューの飽和。当日中に PST を個人OneDriveへ退避し、バックアップ対象から PST 拡張子を除外することで根治。再発防止として ポリシー禁止 + ファイル監査ルール + Prometheus による fs01 ディスクキュー監視追加 を実施。
| 時刻 (JST) | 区分 | 出来事 / 確認内容 |
|---|---|---|
| 09:14 | DETECT | ヘルプデスクへ「保存が遅い」の問い合わせ 3 件。一次受付が Test-NetworkTriage.ps1 を実行、ネットワーク自体は正常と判定 |
| 09:18 | TRIAGE | 別の 2 名から同様問い合わせ。同部署 / 同フォルダに集中していることを確認 → IC を起動し P2 として宣言 |
| 09:24 | INVESTIGATE | fs01 にリモート接続。perfmon で Disk Queue Length 平均 18.4 を確認。通常時の 50 倍 |
| 09:31 | INVESTIGATE | Resource Monitor でディスク高使用プロセスを特定 → バックアップエージェント の I/O が継続 |
| 09:38 | INVESTIGATE | バックアップエージェントの当日ログを確認 → \\fs01\Dept-Sales\営業1課\old\backup.pst (8.7GB) を含むスキャンが進行中 |
| 09:42 | DECIDE | バックアップジョブを 中断ではなく一時停止(中断するとリトライで同事象が再発する判断)。営業部 PM へ状況連絡 |
| 09:46 | DECIDE | PST 4 ファイル(合計 22GB)を一時的に管理者領域へ退避することを決定。ファイル所有者に Teams で連絡 |
| 09:55 | RECOVER | PST 退避完了。fs01 の Disk Queue Length は 0.6 まで低下。利用者数名に動作確認を依頼 |
| 10:02 | RECOVER | 営業部から「保存が瞬時に戻った」確認。問い合わせ受付窓口を継続監視へ |
| 10:30 | MITIGATE | バックアップエージェントの除外パターンに *.pst *.ost を追加し、設定を反映 |
| 11:30 | MONITOR | 1 時間追加の経過観察。Disk Queue Length が継続して 0.5 以下を維持していることを確認 |
| 11:48 | CLOSE | インシデントクローズ。退避した PST は所有者の OneDrive へ移動し、共有フォルダ側を整理 |
| 指標 | 値 |
|---|---|
| MTTA (Mean Time To Acknowledge) | 4 分(09:14 → 09:18 で IC 起動) |
| MTTR (Mean Time To Recover) | 41 分(09:14 → 09:55 で正常動作確認) |
| MTTM (Mean Time To Mitigate, 恒久対処まで) | 1 時間 16 分(09:14 → 10:30 で除外設定) |
| 影響ユーザー数 | 32 名 |
| 業務遅延が発生した承認フロー件数 | 4 件 |
| データ損失 | なし |
*.pst *.ost を追加*.pst *.ost の新規作成を週次レポート化Test-NetworkTriage.ps1 を流していたこと: ネットワーク要因を 4 分で除外でき、ファイルサーバー側の調査に集中できた架空事例につき、登場ユーザー / サーバー名 / ファイル名 / 部署名はすべてダミーです。 本ドキュメントは 「自分はどう振り返るか」 を示すサンプルとして公開しています。