SE の雑記

SQL Server の情報をメインに Microsoft 製品の勉強内容を日々投稿

Azure Stack HCI ノードを Azure Monitor のデータ収集ルールで情報を取得

leave a comment

Azure Stak HCI クラスターのノードを Azure Monitor のデータ収集ルール (DCR) で情報を取得しようとした場合の手順を理解できておらず、SR で情報を提供していただいたので、内容をまとめておきたいと思います。

Azure Monitor で情報を取得しようと思った理由

記憶域スペースダイレクト (S2D) の監視方法を確認していて次のようなドキュメントを確認していました。

ディスクの認識が外れた場合、イベントログの「Microsoft-Windows-StorageSpaces-Driver/Operational」に警告のログが出力されます。

Azure Monitor のイベントログのログ収集には Azure Monitor エージェントを使用して仮想マシンからイベントとパフォーマンス カウンターを収集する で記載されているように、XPath クエリを使用することでアプリケーション / セキュリティ / システム以外のログを取得対象として含めることができます。

この機能を使用して情報を取得するため、Azure Monitor の導入が必要となりました。

 

Azure Stack HCI では 分析情報から Azure Monitor を有効にする

Azure Monitor のデータ収集ルールで情報を取得しようとした場合、オンプレミス環境であれば Azure Arc を導入しデータ収集ルールのリソースとして選択できる状態にして、Azure Monitor Agent の拡張機能を導入するのが基本的な流れになるかと思います。

Azure Stack HCI は Azure Monitor エージェントの概要 で記載されているように、Azure Monitor Agent のサポート対象となっています。

Azure Stack HCI を Azure Monitor のデータ収集ルールで情報を取得しようとした場合、手動でデータ収集ルールを作成しリソースに Azure Stack HCI ノードを追加するという方法では、エージェントが想定通り動作せず、データの収集が行われません。
(データ収集ルールで指定した Log Analytics Workspace に接続されているコンピューターとして認識が行われません)

Azure Stack HCI で Azure Monitor のデータ収集ルールを使用して、Azure Monitor Agent 経由で情報を取得するためには、「分析情報」(Azure Stack HCI インサイト) を使用してデータ収集ルールを有効化する必要があるとのことです。

上記のドキュメントには次の記載があります。

独自の DCR を作成しないことを強くお勧めします。 Insights によって作成された DCR には、その操作に必要な特別なデータ ストリームが含まれています。 この DCR を編集して、Windows イベントや Syslog イベントなど、より多くのデータを収集できます。 AMA インストールによって作成された DCR には、DCR 名が付いたプレフィックス AzureStackHCI- が付けられます。

独自の DCR を作成しないことが推奨されていますが、これは推奨ではなく、必須要件となり、Azure Stack HCI では分析情報から作成した「AzureStackHCI-」のプレフィックスが付けられて作成された DCR でないと Azure Stack HCI クラスター並びに、Azure Stack HCI ノードの情報を Azure Monitor Agent を使用して取得することはできませんでした。

Azure Stack HCI リソースのブレードの分析情報から、情報の取得を有効化すると、Azure Stack HCI クラスターが取得対象リソースとして指定されたデータ収集ルールが作成されます。

Azure Stack HCI クラスターが登録された状態では、クラスター内のノードも自動的に取得対象となり、各ノードを追加することなく情報の収集を行うことができるようになっています。

 

作成されたデータ収集ルール (AzureStackHCI- で始まる DCR) については、作成後のカスタマイズが可能です。デフォルトでは次のような Windows イベントログが取得されています。

  • Microsoft-Windows-SDDC-Management/Operational!*[System[(EventID=3000 or EventID=3001 or EventID=3002 or EventID=3003 or EventID=3004)]]
  • microsoft-windows-health/operational!*

作成されたルールに対して、イベントログのカスタムのクエリとして「Microsoft-Windows-StorageSpaces-Driver/Operational!*[System[(Level=1 or Level=2 or Level=3)]]」を追加したところ、今回取得したいと考えていた情報を収集することができました。

image

このイベントはディスクの認識が外れた際に出力されるログとなっており、ディスク障害でディスクが認識しなくなった場合にこのエラーで検知ができるかと思います。(OS の起動直後にも出力されるため、Heartbeat のログと組み合わせる必要はあると思いますが)

 

Azure Stack HCI の監視

Windows Admin Center (WAC) からも稼働状況は確認できますが、WAC では監視の機能はないので、Azure Stack HCI の監視 (モニタリング) については、Azure の機能を組み合わせて実施することになるかと思います。

どのような監視ができるかについては、次のドキュメントのドキュメントツリーから確認ができます。

Azure Stack HCI クラスターでは、「SDDC の管理 (SDDC Management)」(SDDC: Software-Defined Data Center) というクラスターリソースが動作しており、このリソースから Azure に送信されている情報もあります。

ログの収集は 1 時間ごとに実行されており、ログ収集の頻度 で頻度を変更することができ、15 分までは下げることはできるようです。

Share

Written by Masayuki.Ozawa

6月 14th, 2023 at 9:06 pm

Posted in Azure Stack HCI

Tagged with

Leave a Reply