この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので十分ご注意ください。
概要
Amazon EFS ファイルシステムは自動的にバックアップを取得することができますが、バックアップが失敗する場合、自動通知が行っていません。今回はCloudWatchAlarmを利用して、バックアップ失敗事件の監視方法を説明します。
前提
●EFS自動バックアップが有効
作業ステップ
CloudWatchAlarmの作成
監視メトリクスを選択する時、利用したいの"NumberOfBackupJobsFailed"が表示されないですので、対象バックアップボールトの"NumberOfBackupJobsCreated"を選択して、後で手動修正を行います。
手動修正前
手動修正後(今回のメトリクスは複数のバックアップを作成する場合もあるので、合計と5分間を選択します)
条件を下図のように設定します。1回で1つのジョブだけが失敗すれば、アラームが上がります。
メトリクス"NumberOfBackupJobsFailed"はジョブが実行成功しても"0"を出力しなくて、データ不足の状態なので、欠落データを適正に設定します。
アラームになる時、通知の送信先を設定します。
分かりやすいようにアラーム名を設定して、アラームを作成します。
作成したアラーム
実装結果の検証
アラームの実装が終わりましたので、バックアップ失敗の監視ができるかどうかを検証しましょう。
テスト用EFSを作成して、自動バックアップを有効にします。
10分後にテスト用EFSを削除して、AWS Backupの"aws/efs/automatic-backup-vault"バックアップボールトから削除されたテスト用EFSのバックアップを手動で作成する。
↓
対象EFSは削除されたので、バックアップジョブが失敗になりました。
5分後に上記作成したアラームも上がります。
受信を確認して、バックアップ失敗の監視ができることを検証しました。
最後に
ジョブ実行失敗の監視方法はCloudWatchAlarmだけではなく、Amazon EventBridgeのルールも可能です。時間があったらイベントルールの監視方法を検証しましょう。