2017年10月29日日曜日

System Center Operations Managerのエージェントレス監視とイベントログ 10028

最近、System Center Operations Managerのエージェントレス監視しているサーバー(今回は仮想マシンでしたが)を停止したところ、他サーバーの監視も含めて通知メールが一切飛ばないという事象に遭遇しました。
これは、マイクロソフトのプレミアサポートにご支援いただき無事解決したのですが、少し顛末をまとめておきます。

この判断ポイントは、イベントログ 10028の発生です。
手元の環境でもイベントログを検出できていたので、下記に貼っておきます。

※タイムスタンプはUTCです、念のため。

エージェントレス監視しているサーバーに対して、上記のイベントログが出ていると、SCOM自体の動作が不安定になっている可能性があります。その結果として、一切の通知メールが飛ばなくなることがあります。
本件に関しては、明示的にプロキシを構成しませんでした。ということはSCOMサーバーがプロキシになっていたわけです。

エージェントレス監視のベストプラクティスは、
エージェントレス監視のプロキシを構成する方法
にある通り、明示的にプロキシを構成することです。
が、前述の通り、プロキシとなっていたSCOMサーバーが不安定になっていました。
つまり、特定のエージェント監視しているサーバーをプロキシにしても、影響範囲が小さくなるだけということに。。。

このイベントログを発生させないこと、つまり不安定な状況を回避するには、エージェントレス監視のサーバーに対しメンテナンスモードを使います
※障害が発生するとそうもいきませんけど。
なお、監視対象から削除してしまえば発生しませんが、通常はサービス停止にともなうサーバー撤去といったケースになってしまうでしょう。

ということで、できれはこの挙動が改善されることを願ってやみません。

System Center 2016 Operations Manager Update Rollup 4が出ました

quarterごとにリリースされているので、9月に出るかと思ったら10/25にでました。
Description of Update Rollup 4 for Microsoft System Center 2016

Update Rollup 4 for System Center 2016 Operations Managerによると、いくつかの修正とともに TLS 1.2 Protocol Support というトピックがあるようです。

早速、適用してみようと思ったら、Windows Updateで出てきました。
※UR3までは、手動だったのでこれは助かる。


SC 2016 OMのManagement ServerへのUR4適用後、再起動が必要でした。

上記がおわったら、毎度のSQL Scriptを実行します。
※これいつになったら、手動じゃなくなる?!
"インストール先のドライブ":\Program Files\Microsoft System Center 2016\Operations Manager\Server\SQL Script for Update Rollups

タイムスタンプは2017/04/26から変わっていませんね。

use OperationsManager;
go
をSQL Scriptの冒頭に追加して実行。


UR4適用に伴い、管理パックもアップグレード(インポート)します。
"インストール先のドライブ":\Program Files\Microsoft System Center 2016\Operations Manager\Server\Management Packs for Update Rollups






すでにインポート済みのものばかりで、インポートはできない(しなくても良い)ので、キャンセルします。
キャンセルの確認を了承しておきます。


Nano ServerのAgentアップデートが必要ですが、当該環境にはないのでスキップします。

毎度のUNIX/Linux管理パックをアップグレードします。
System Center Management Pack for UNIX and Linux Operating Systemsよりダウンロードします。
こちらは、2017/09/18にリリース済みなんですね。



管理パックを展開します。
とはいえ、MSI的には、既にインストール済みなので、Reinstallになります。



管理パックをインポートします。ここではLinuxと依存関係で必要なもののみインポートします。
これもインポート済みのようでした。
※すみません画面ショット撮り忘れてました。
気になったので、一度MSIファイルをアンインストールして再インストール後、もう一度インポートを試してみました。

やはりインポート済みでした。

最後にAgentを更新しておけばOK。


2017年10月15日日曜日

Project Honolulu の Hyper-Converged Cluster Manager はどんな画面がある?

Project Honolulu の Hyper-Converged Cluster Manager はどんな画面があるか見てみます。
※途中、エラーが出ていますが、Project Honoluluが原因なのか、管理対象にしているWindows Server Insider Preview 16278が原因なのか、切り分けしていないので、as isとしてみてください。

管理画面への追加は、こうなっております。

追加完了。



Overviewは、えらーになってしまうので、再ロードします。


警告を確認できますが、概要です。


ドライブの概要。

ドライブのインベントリー、警告出ています。


やはり各ノードとの接続不調が響いているのか、警告が出ています。


ただ各ノードは、Helthyになってますね。。。


接続不調が影響しているのか、仮想マシンはうまく見えず。


接続不調が影響しているのか、仮想スイッチもうまく見えず。


ボリューム画面も最初はエラー発生。

リロードしたら表示されます。


Project Honolulu の Failover Cluster Manager はどんな画面がある?

Project Honolulu の Failover Cluster Manager はどんな画面があるか見てみます。
※途中、エラーが出ていますが、Project Honoluluが原因なのか、管理対象にしているWindows Server Insider Preview 16278が原因なのか、切り分けしていないので、as isとしてみてください。

Failover Cluster Managerに切り替えて、Failover Clusterを追加します。クラスターノードも認識しています。

追加できました。


クラスターの概要画面。


クラスターのリソースを開始や停止などが可能です。


CSVを選択したら、エラーになってしまいました。

もう片方も選択可能ですけど、パフォーマンスがなかなかでなかった。


クラスターネットワークで、各ノードの情報が確認できます。


ノードの管理画面。開始、停止のほか管理もできるようです。

が、上手く接続できない様子。

GUIのサーバーマネージャーから見てもうまくないです。


役割の画面。Windows Server Insider Preview 16278でHyper-Vを入れていますが、上記の接続不調が起因しているのか、見えず。


仮想マシンの概要でエラー発生。


仮想スイッチもうまく見えません。


Windows Server Insider Preview 16278の設定かと思い、winrm quickconfigを実行してみましたが、すでに動作済み。


RPCサーバーが利用できません。 です。


GPOでポート開放をいくつかのパターンで試してみます。







芳しくない。


さらにポート開放を試してみます。



芳しくない。



管理回り、Windows Server 2016のFailover Clusterでも試さないといけないですね。orz