ksaitoの日記

日々試したことの覚え書き

ZABBIXとNagios

ZABBIXに少し慣れてきました。
ZABBIXもNagiosも監視ソフトとして必要な機能を備えていますが細かなところで違いがあります。
間違っていることを書くかもしれませんが、所見は、今しかかけないので書いておきます。

設定

設定は、テキストファイルベースとWebインタフェースベースと対象的です。
Nagiosの設定ファイルは、オブジェクトの設計が良ければサーバ数に関係なく設定できます。
うまくいくと強力なのですが、設計が悪いまま量産してしまうと身動きできなくなってしまいます。(自業自得でNagiosのせいではありません)

ZABBIXは後発だけにUIの見栄えはよいですがオブジェクトの選択の操作に戸惑うことが多いです。
おそらく、ホスト、テンプレート、グループに、それぞれアイテム、トリガー、アクション、グラフが関連、作成/選択する手段が、ボタン、リンク、ポップアップ、ボタン+別ウインドウからリンクで選択...と様々で、一貫性がないからではないかと思います。(というか、本質的に複雑なんですね。)

設定は、(1)構造の理解、(2)設定ツールの慣れ、(3)設定変更の経験量が大切だと痛感します。

グラフ

Nagiosのグラフは、正直設定がとても大変な割に、あまり参照しません。
ZABBIXは、収集したデータを組み合わせて後から柔軟にグラフが作れます。
また、作ったグラフを並べて1画面で見れるのがとても良いです。
「セッションの数の推移と、サーバリソースの変化、プロセス数の変化を時系列で見たい」といったことが割と簡単にできてしまいます。

通知

通知については、根本的に考え方が違うように感じます。
Nagiosは、障害発生/復旧といったイベントは管理している人に知らせるのが基本、通知がスパムメールにならない工夫(フラットや親子関係を定義することによる通知の抑制)がされています。
ZABBIXは、これらのイベントをデフォルトで通知しないのが基本、通知して欲しいイベントをトリガー+アクションで定義します。

拡張

Naigosは、枠組みを理解するとシェルで扱えるデータを全てを監視することができます。
これは、プラグインが1行のテキストを、あるフォーマットに従って出力できるプログラムという以外の制約がないためです。
ZABBIXは、NagiosのNRPEのような仕組みもあるようですが、良く理解していません。
デフォルトで用意されているテンプレートで、かなりの部分をカバーしているのとオフシャルサイトでは、追加のテンプレートも公開されているようです。