CloudWatchでEFS自動バックアップの失敗を監視する


この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので十分ご注意ください。

概要

Amazon EFS ファイルシステムは自動的にバックアップを取得することができますが、バックアップが失敗する場合、自動通知が行っていません。今回はCloudWatchAlarmを利用して、バックアップ失敗事件の監視方法を説明します。

前提

●EFS自動バックアップが有効

作業ステップ

CloudWatchAlarmの作成

監視メトリクスを選択する時、利用したいの"NumberOfBackupJobsFailed"が表示されないですので、対象バックアップボールトの"NumberOfBackupJobsCreated"を選択して、後で手動修正を行います。
file

手動修正前
file

手動修正後(今回のメトリクスは複数のバックアップを作成する場合もあるので、合計と5分間を選択します)
file

条件を下図のように設定します。1回で1つのジョブだけが失敗すれば、アラームが上がります。
メトリクス"NumberOfBackupJobsFailed"はジョブが実行成功しても"0"を出力しなくて、データ不足の状態なので、欠落データを適正に設定します。
file

アラームになる時、通知の送信先を設定します。
file

分かりやすいようにアラーム名を設定して、アラームを作成します。
file

作成したアラーム
file

実装結果の検証

アラームの実装が終わりましたので、バックアップ失敗の監視ができるかどうかを検証しましょう。

テスト用EFSを作成して、自動バックアップを有効にします。
file

10分後にテスト用EFSを削除して、AWS Backupの"aws/efs/automatic-backup-vault"バックアップボールトから削除されたテスト用EFSのバックアップを手動で作成する。
file

file

対象EFSは削除されたので、バックアップジョブが失敗になりました。
file

5分後に上記作成したアラームも上がります。
file

受信を確認して、バックアップ失敗の監視ができることを検証しました。
file

最後に

ジョブ実行失敗の監視方法はCloudWatchAlarmだけではなく、Amazon EventBridgeのルールも可能です。時間があったらイベントルールの監視方法を検証しましょう。

Last modified: 2022-07-21

Author