Before
- 複数の AWS 環境を運用しているため、サービス障害発生時に原因を特定するのに時間がかかる状況だった。
- 従来のインフラ監視やサービスの維持だけでなく、さらなるサービスレベルの向上につながるオブザーバビリティの強化や指標の見直しが必要だった。
After
- 複数のAWS環境にNew Relic One を導入することで、統一的なプラットフォーム上で障害発生から原因特定までのリードタイムの改善が可能に。
- 監視設定を手動設定からコード管理に置き換えることで、監視設定のテンプレート化や使い回しが容易になり、管理コストを削減。
- アプリケーション(New Relic APM)やブラウザ(New Relic Browser)などのインフラレイヤー以外のオブザーバビリティも強化。
- SLI(サービスレベル指標)/SLO(サービスレベル目標)を策定し、サービスの信頼性を維持しながらユーザー体験の継続的な改善活動が可能に。
株式会社カーフロンティア様(以下、カーフロンティア様)は、豊かなカーライフの実現を目的として、カーメンテナンス検索・予約サービスやメンテナンス事業者向けの予約台帳管理システムなど、様々なSaaS型のサービスを提供しています。同社はAWSで運用しているシステムのオブザーバビリティ(可観測性)強化のために、New Relicの導入を計画し推進していました。その中でアイレットが「New Relic One」の導入促進をはじめとするオブザーバビリティ強化をサポートさせていただきました。
複数の AWS 環境を統合的にモニタリングするオブザーバビリティ強化により、ユーザー体験の向上を目指す
カーフロンティア様はお客さまに提供するサービスを、複数の AWS 環境で運用されています。同社はサービスレベルのさらなる向上を実現すべく、障害などが発生した際に迅速な原因特定や初動対応を含むオブザーバビリティの強化を目指していました。
複数のAWS環境を運用する中で、障害発生時の対応を早急に行なうためには、各環境を統合的に観測する仕組みの構築が欠かせません。同社では New Relic を導入し、オブザーバビリティの強化を進めていましたが、社内のリソースやノウハウが十分に確保できないところに課題を抱えていました。そこでアイレットは「New Relic One 導入支援サービス」をご提案し、オブザーバビリティプラットフォーム「New Relic One」の導入支援をはじめとする、オブザーバビリティ強化に向けた様々な支援をさせていただきました。
監視設計・導入から SLI/SLO 策定まで、計画の実現に向けた様々な支援を実施。管理コストを削減する Infrastructure as Code 化も支援
導入にあたって、まずは既存環境の監視項目を精査した上で、カーフロンティア様のサービス特性や理想とするユーザー体験、運用における効率性などを元に、各種監視設計や通知項目の閾値設定などを行ないました。
その中でも注力したポイントの一つが、今後の運用を見据えた負荷軽減です。弊社ナレッジを元に監視識別用の統一されたタグを各 AWS リソースに付与したり、NRQL (New Relic 上に取り込んだ様々なデータにアクセスするためのクエリ言語) の記述を統一し可読性を高めたりするなど、運用を意識した監視設計を実施しました。
その結果、カーフロンティア様で計画されていたTerraform を使用した監視設定のコード管理 (IaC : Infrastructure as Code) との親和性も高く、実現に向け大きく貢献できました。
なお、カーフロンティア様は既存サーバーを EC2 で構築していましたが、将来を見据えてAWS 上の別のコンテナやサービスに移行することを計画されていたので、環境移行に伴う監視移管もサポートさせていただきました。
また、サービスレベルの継続的な改善を可能にすべく、「New Relic Service Levels」を活用した応答速度やレスポンス成功率などのSLI 計測手法の策定からSLO定義、可視化まで、お客さまと何度も対話を重ねながら実現に向けて支援を行ないました。
ダッシュボード機能を活用し複数レイヤーを一元的に可視化。問題発生後だけでなく、事前の分析も含めたオブザーバビリティを強化
New Relic One の導入によって、インフラだけでなくアプリケーションやユーザー体験まで、複数のレイヤーに渡ってサービス障害をいち早く検知し、原因の特定が容易な環境構築ができました。
さらに、ダッシュボード機能を活用し、これら複数レイヤーの情報を一元的に管理することで、アクセス分析なども含めたプロアクティブな活動も可能となります。
引き続き、複数システムのSLI/SLO をダッシュボード上で可視化していくことで、サービスレベルからエラーバジェット(一定期間のあいだに許容できるエラーの量)の確認まで、サービス信頼性を維持しながらユーザー体験の継続的な改善活動をご支援いたします。
近年、システムのクラウド移行が多様化・複雑化する中で、障害検知時の素早い原因特定やシステムの内部状態の把握を含むオブザーバビリティへのニーズが高まっています。アイレットはこれまでのノウハウを活用して従来のインフラ監視だけでなく、オブザーバビリティの強化にも対応し、ユーザー体験の向上に寄与するソリューションをご提供いたします。
(利用したNew Relic機能)
- ・New Relic APM
- ・New Relic Browser
- ・New Relic Dashboards
- ・New Relic Logs
- ・New Relic Infrastructure
- ・New Relic Synthetics
- ・New Relic Service Levels
- ・New Relic Workloads
(AWSプロダクト)
- ・Amazon EC2
- ・Amazon Elastic Container Service
- ・Amazon RDS
- ・Amazon ElastiCache
- ・Application Load Balancer
- ・AWS Fargate
Credit
クライアント株式会社カーフロンティア