nagios
ZABBIXに少し慣れてきました。 ZABBIXもNagiosも監視ソフトとして必要な機能を備えていますが細かなところで違いがあります。 間違っていることを書くかもしれませんが、所見は、今しかかけないので書いておきます。
プロセスの数やメモリ、CPUの上限を監視するには、check_procsを使います。 プロセス数の監視 -Cは、psのcommandの数を監視します。-aを使うとオプションなども含めて数えることができます。 $ ./check_procs -C bash -w 1 -c 4 PROCS WARNING: 4 processes …
データベースに指定したQueryを発行した結果を監視する方法は、あまり汎用的な方法がないようです。 NagiosExchangeで見つけたcheck_sql_queryを試してみました。 Oracle専用なのでOracleがセットアップされている環境で利用できます。 接続情報が書かれたフ…
Webサーバでhttpsを使う場合、サーバ証明書をセットアップします。 自己署名するか商用の証明書を購入しますが、いずれも有効期限があり期限が切れると予期せぬトラブルの元になります。 nagios3で、この証明書の有効期限を監視することができます。
NagiosExchangeにJMXを監視するプラグインがあります。 Nagiosに組み込む前にプラグイン単体で動きを確認しました。 プラグインのダウンロード $ wget -O check_jmx.tgz 'http://www.monitoringexchange.org/cgi-bin/jump.cgi?ID=3002&view=File1;d=1' $ tar…
Nagiosは、設定ファイルを手で修正するためタイプミスや勘違いでNagiosが起動しなくなることが良くあります。 複数台の異なるバージョンのnagiosを使っているとコマンド名や設定ファイルの位置の微妙な違いで操作を間違えることもあります。 Makefileを用意…
Nagiosの監視対象が増えてくると、Naigosサーバの負荷が心配になります。 nagios2statsやnagios3statsの監視の遅延をモニタするプラグインを導入すると計画されていた監視のタイミングから実際に監視が実行されるまでの遅延を監視できます。
nagiosで監視するサーバやサービスは、すぐに増えます。 システムは、いくつかのサーバで稼働する複数サービスで構成されているので、これらをひとまとめにすると確認しやすいです。 例えば、redmineが正常に稼働していることを確認するには、Webサーバ、MyS…
nagios-pluginsには、DHCPサーバを監視するためのプラグインがあります。 このプラグインは、HDCPサーバに問い合わせをするためにroot権限が必要です。 Nagiosに組み込み監視するには、sudoと組み合わせる必要があります。こんな感じになります。
hostextinfoという設定で監視対象のサーバの構成や操作手順を書いたwikiの情報をリンクできます。 notes_urlにサーバの構成情報、action_urlに操作手順を書くと意外と便利かも... define hostextinfo { host_name Server1 notes_url http://wikiサーバ/notes…
バックアップ作業は、自動化して手間を省きたいです。 自動化しても、きちんと動いているか確認していないと、いざという時にバックアップがとれていなかったという困ったことになります。 Nagiosで監視しておくと自動化したタスクが失敗したときにメールで…
nagiosgrapherは、Nagiosで監視しているサーバとサービスのパフォーマンス情報をグラフにしてくれるNagiosのプラグインです。 あまり情報がないので、設定方法が良くわかりませんでした。 muninを設定したのでnagiosgrapherは、無理して設定しなくていいかな…
Nagios 2.0オープンソースではじめるシステム&ネットワーク監視のパッシブサービスチェックに書かれているTCP Wrapperと連携して不正アクセスを監視する設定をUbuntuで設定してみました。 この設定で、/etc/hosts.denyで接続を拒否したIPからのアクセスがあ…
パッシブチェックは、常時起動していないマシンやネットワークの構成上、nagiosサーバからアクセスできないマシンの監視、イベントとして発生する事象の監視をするための仕組みです。 今回、クライアントPCのディスク容量を監視したいのでnagios3のパッシブ…
NagiosのWebインタフェースには、監視対象のサーバの障害対応中に通知メールを大量に送信しないように"Acknowledge this service problem"というステータスにして簡単なコメントを入力できます。Webインターフェースには、工事中のアイコンが表示され障害対…
Nagios2の設定をブラウザからやる必要があり、NagiosQLを試してみました。 個人的には、コンフィグファイルをテキストエディタで編集するやり方が好きですが他の人に設定をお願いする場合は、ブラウザから変更できると何かと便利です。 NagiosQLへの切り替え…
Nagios2でBASIC認証のサイトを監視するには、IDやパスワードを設定する必要があります。 IDとパスワードを設定するファイルのアクセス権 IDやパスワードは、/etc/nagios2/resource.cfgに設定します。 パスワードは、暗号化されていないテキストなのでアクセ…
Nagios2の監視は、アクティブチェックとパッシブチェックがあります。 通常は、アクティブチェックでNagios2サーバが対象サーバを監視しますが、パッシブチェックの場合は、Nagios2サーバが直接監視をせず、監視対象が外部コマンドファイルに登録した情報を…
Nagios上では、パフォーマンスデータがあるのにPerfParseにデータが表示できなくなってしまいました。 よく分からなかったで、パフォーマンスデータ用のデータベースを初期化してみました。 これでしばらく様子を見ます。 データベースの削除と作成 $ mysql …
Nagios2のプラグインにcheck_aptというのがあります。 'apt-get update'をcronやpuppetといった手段で定期的に実行していることが前提ですが、アップグレード可能なパッケージやセキュリティのアップデートがあると警告してくれるらしいです。 設定 aptでNag…
nagios2で監視しているサーバにアイコンを付けてみました。Debianのnagios-imagesパッケージで代表的なアイコンが準備されているようです。
nagios2の管理画面からパッシブの監視ステータスを変更できるのですが、下記のようなエラーになってしまいます。 いろいろ調べた結果、nagios2のパッケージの不具合のようでした。 Error: Could not stat() command file '/var/lib/nagios2/rw/nagios.cmd'! …
Windowsサーバの監視は、NRPE_NTというエージェントとNRPE_NT Pluginを使います。 CPUのロードアベレージとメモリ、ディスク、イベントログ、Windowsサービスの監視ができます。 NagiosExchangeには、他にもたくさんのプラグインがあるので、たいていの監視…
nagiosの設定は、テキストファイルベースの設定なので、しばらく使っていなかったので忘れてしまいました。 やっぱり、書いておかないとダメですね。ということで覚書です。/etc/nagios2に設定ファイルが格納されています。ここには、設定の雛形が用意されて…
ping監視の設定で/etc/nagios2/conf.d/services.cfgに下記のように設定しました。 ここに設定したcheck_commandがnagiosの監視のポイントになります。 check_pingの後ろ"!"区切りの文字列は引数でpingの応答時間とパケットロスの閾値を設定しています。 一つ…
UbuntuとDebianの環境のnagios2にPerfParseをインストールしました。 PerfParseは、nagios2のプラグインとしてパフォーマンスデータをグラフ化してくれます。
nagios2では、パフォーマンスデータを監視のときに収集することができます。 /etc/nagios2/nagios.cfgの設定を修正します。 $ diff -u nagios.cfg /etc/nagio s2/nagios.cfg --- nagios.cfg 2007-09-01 21:51:42.221765699 +0900 +++ /etc/nagios2/nagios.cf…
DNSサーバの監視 /etc/nagios-plugins/config/dns.cfgにDNSサーバを監視するコマンドが定義されています。 # 'check_dns' command definition define command{ command_name check_dns command_line /usr/lib/nagios/plugins/check_dns -H www.google.com -s…