AWS Healthのイベント情報を一元管理するダッシュボードを作成し、作業効率を大幅改善!イベント情報管理システムの構築

アイレット株式会社

システム開発

アイレット株式会社

アイレット株式会社のクラウドインテグレーション事業部 MSPセクションでは、お客さまの各 AWS 環境に影響を与える可能性がある問題や変更などの通知(AWS Health イベント)に従って、AWS 環境内のメンテナンス対象のリソースを操作したり、障害から保護する役割を担っています。この業務を効率化すべく、AWS Health のイベント情報管理システムを自社で構築いたしました。

Before

  • AWS Health の運用が部署間での二重管理となっており、確認・連絡フローが煩雑になっていた。
  • 情報共有先が、スプレッドシート、Backlog、Slack チャンネルと分散していた。
  • お客様への連絡手段として Backlog を使用しているが、手作業による起票のため誤起票のリスクがあった。

After

  • AWS イベント情報管理システムの構築と運用フローの変更で、二重管理を解消!
  • ダッシュボードを作成し、AWS Health イベント情報をUI画面で一元管理化。
  • AWS イベント情報管理システムと社内のお客さま情報を紐付け、起票先 Backlog プロジェクトを自動で判定することで誤起票を防止。

大量の AWS Health イベントの発生を監視する担当者と、お客さまに作業連絡する担当者が異なるため、二重管理によるムダが生じていた

AWS Health とは、AWS 環境に影響を与える可能性がある問題や変更点、メンテナンス情報などをイベント通知するサービスです。お客さまの AWS 環境を運用保守しているアイレットでは、日々発信される大量の AWS Health のイベント通知の中から対応が必要な情報をお客さまに共有した上で、メンテナンス対象のリソースを操作し障害から保護する作業を行なっています。

当初、アイレットではMSPセクションがイベント監視(一次運用)を担い、メンテナンスメールや Slack 通知で受信したイベントをスプレッドシートへ転記し、社内用の Backlog もしくは Slack で各運用保守担当者に連絡していました。そして、連絡を受けた運用保守担当者がスプレッドシートや AWS Personal Health Dashboard を確認した上で、Backlog にて各お客さまへ連絡し、対応していました(二次運用)。

しかし、この運用フローでは一次運用から通知されたイベントがお客さまに連絡すべきイベントなのか判断が付かないため、本来は連絡する必要がなかったイベントも二次運用の担当者に連絡しており、その担当者も当該イベントがお客さまに連絡すべきものなのかを逐一確認しなければなりませんでした。

加えて、イベント情報の管理や連絡にスプレッドシート、Backlog、Slack と複数のツールを用いていたため、担当者間での情報共有が煩雑になっていました。さらに、二次運用でお客さま Backlog への手作業で起票を行なっていたため、人的な起票ミスが発生するリスクもありました。

AWS Health イベント情報の確認から進捗管理までを専用のダッシュボードで一括管理。二重管理が解消され、作業効率と精度が大幅に向上!

こうした課題を解決すべく、アイレットでは AWS Health のイベント情報を自動的に収集し一覧で表示する社内システム「AWSイベント情報管理システム」を構築しました。

このシステムでは、アイレットが運用保守を行なっている AWS 環境で発生した AWS Health イベントを自動で定期的に収集します。収集したイベントは、運用保守を担当するグループ単位で管理し、ダッシュボードで一覧表示するようにしました。また、イベントが発生した場合は、各グループに紐付けた Slack チャンネルへイベント発生を通知します。Amazon EC2 や Amazon RDS など特にお客さまへの連絡頻度が高いイベント情報はカテゴリ化して表示し、どのカテゴリのイベントを Slack に通知するのかを設定することもできます。

ダッシュボードでは、各イベントに対して対応状況の管理と、お客さま Backlog への直接 起票が可能になっています。分散していたイベントの参照先を一元化でき、Backlog 誤記票のリスクもなくすことができました。

AWS イベント情報管理システムを活用した運用フローに変更することで、MSPセクションが対応していた一次運用が不要になり、二次運用のみで完結できるため、イベント情報の二重管理が解消されます。そして、ダッシュボードでイベント情報の一元管理や Backlog への起票が可能になることで、作業効率や精度が大幅に向上します。一連の作業を最適化することで、AWS の保守運用を高い品質でスピーディーにご提供していきます。

今後も社内サービス向上のためにシステムのブラッシュアップを続けるとともに、他の運用フローにもこの仕組みを応用できないかを検証・展開し、お客さまのビジネス発展につなげてまいりたいと思います。

システム構成図
アイレット株式会社イベント情報管理システム構成図

(AWSプロダクト)

  • ・AWS Amplify
  • ・AWS Lambda
  • ・Amazon DynamoDB
  • ・Amazon S3
  • ・Amazon CloudFront
  • ・Amazon API Gateway
  • ・AWS Systems Manager Parameter Store

Credit

クライアントアイレット株式会社