今月、Expanding the Public Preview of the Azure SRE Agent でアナウンスされましたが、Enterprise-Ready and Extensible: Update on the Azure SRE Agent Preview で限定的な Preview として公開されていた Azure SRE Agent が Public Preview となり、広範囲で使用できるようになりました。
先日開催された Japan Azure User Group 15周年イベント のセッション内でも、このサービスの話題があったのですが SRE Agent の情報を軽くまとめておきたいと思います。
Contents
Azure SRE Agent について
SRE Agent については、Azure SRE Agent でドキュメントが公開されていますが、次の二つの記事が分かりやすいかと思います。
SRE Agent は自然言語を用いて、発生している問題についての根本原因の解析と対応案の提示を行うことができます。
Copilot in Azure との違いについて
Copilot in Azure で得られる回答
類似の機能として思い浮かべられるのが、Microsoft Copilot in Azure となりますが、SRE Agent のほうが詳細に問題に対してのアプローチを行うことができます。
2025/10/06 14:41~15:54 (JST) で AppService xxxxx が停止していたようです。原因を確認してください。
というプロンプトを使用したとします。
Copilot in Azure では、次のような回答を得ることができます。
Copilot in Azure では、汎用的な問題の調査方法について提示が行われました。
Azure SRE Agent で得られる回答
同様のプロンプトを Azure SRE Agent で使用してみます。
以下の画像は「Deep investigation」を使用して詳細に調査を行わせたものとなります。
Azure SRE Agent では通常のプロンプトによる問題の調査の他に「Deep investigation」による調査を行うことができ、この機能を使用した場合「Incident resarch」「Hypothesis」「Conclusion」の 3 ステップで問題に対しての調査を行うことができます。
Copilot in Azure では汎用的な調査内容の提示となっていました。
Azure SRE Agent は、確認を依頼した問題に関連するリソースに関する各種メトリック (リソースのアクティビティログ / Application Insights / Application Insights で使用している Log Analytics Workspace 等) の情報を、マネージド ID を使用して取得します。
これにより、実際の状態を確認しながら詳細な調査が行われています。
今回のプロンプトの時間帯は手動操作で App Service を停止していたのですが、管理者操作により停止していたことを SRE Agent が判断できています。
上記は発生している問題に対しての対応を依頼しましたが「xxxx のリソースグループのリソースについて、改善案を提示することはできますか?」というような、プロンプトを使用することもできますので、発生している問題に対してだけでなく、既存のリソースの調査についてのアプローチも実施することが可能です。
次のような機能もあり、これらの機能についてはバックグラウンドで自動的に実行され報告が行われます。
- インシデント管理 : Azure Monitor のインシデントアラートを SRE Agent に連携し、解析を行う。
- Daily Report: 各日の状態をレポーティング
- CVE Scanner: アプリケーションで使用しているリポジトリ (GitHub / Azure DevOps) をリンクし、脆弱性のスキャン
- リンクしたリポジトリは問題発生時のコード解析にも使用されるようです。
- Local Auth Scanner: Azure リソースのローカル認証設定に問題がないかのスキャン
また、Daily Report の機能もあり、レポートは自動的に生成されますので、日々の状態の確認も行うことが可能です。
日本語のサポート状況
質問のプロンプトは日本語で入力しても調査を開始することができています。
回答は基本的には英語で行われると思ったほうが良いかと。
「日本語で回答してください」といった指示を最初に実施していた場合でも、最初は英語で進められていたものが途中で日本語に変わるというような挙動だったことがあります。
Copilot in Azure との違いと思った点
Copilot in Azure では汎用的な回答が行われ、調査は自分で実施するケースがあります。
SRE エージェントでは実際のリソースの各種情報を取得して調査が行われるため、詳細な状態の確認をエージェントに依頼することができるのは特徴の一つとなりそうですね。
調査可能なリソース
Microsoft Copilot in Azure では、App Service / Container Apps についてのチュートリアルが公開されていますが、Expanding the Public Preview of the Azure SRE Agent では次のように記載されています。
Covering the breadth and depth of Azure: The Azure SRE Agent helps teams manage and understand their entire Azure footprint. With built-in support for AZ CLI and kubectl, it works across all Azure services. But it doesn’t stop there?diagnostics are enhanced for platforms like PostgreSQL, API Management, Azure Functions, AKS, Azure Container Apps, and Azure App Service. Whether you’re running microservices or managing monoliths, the agent delivers consistent automation and deep insights across your cloud environment.
Zenn の記事では Azure VM を対象として検証されていますが、チュートリアルに公開されているリソース以外の診断についてもサポートがされているようです。
SQL Database で試してみたところ、SQL Database についても SRE Agent で調査が行われていました。
SRE Agent は、調査対象とするリソースグループを登録して利用を行いますが、何か問題が発生した場合は該当のリソースが含まれるリソースグループ名 / 時間 / 事象の概要をプロンプトに入力して調査を依頼してみるという使い方をすれば、各種リソースに対して何らかの回答が得られるかもしれませんね。
Azure SRE エージェントのコスト
基本コスト
Azure SRE エージェントのコストについては次の情報から確認できます。
Azure SRE エージェントのコストは、Always-on フロー / アクティブ フロー の 2 種類で構成されています。
「Always-on フロー」は Azure SRE Agent をデプロイしている時間発生する固定コストとなります。
SRE エージェントあたり「4 AAU ×デプロイしている時間」コストが発生し、1 ヶ月 (730 時間) 展開しているのであれば、投稿時点のレートでは「¥43,656.92/月」(¥1,418.016/日) 程度のコストが発生することになります。
「アクティブフロー」は SRE Agent がタスクを実行する際に発生し、実際の調査等の処理が行われた場合に、発生するコストとなります。
SRE Agent では、「Always-on フロー」のコストは固定で発生するものとなりますので、年間で「¥523,883.04」程度の予算が最低でも必要になるのは意識しておく必要がありそうですね。
Grafana のコスト
Azure SRE Agent ではダッシュボードに Managed Grafana が使用されます。Grafana のダッシュボードを使用しないという構成もできるのですが、次のようなダッシュボードを使用したい場合には、Grafana のコストも追加で考慮しておく必要があります。(投稿時点では、Essential のサービスレベルでも動作しているのですが、今後 Essential は使用できなくなるため、Standard SKU のコストは見積もっておく必要があります)