nagios 是一个非常强大的监控软件,当你了解他时,几乎是不所不能;
本案例讲解如何用nagios 监控远程主机的进程是否存活:
首先要了解,nagios利用返回代码来判断服务状态:0为ok,1为warning,2为critical,3为unknow。了解这些之后,写脚本就简单的多了
[root@localhost libexec]# cat check_mem
#!/bin/bash#
mem_tatol=`free -m|awk NR==2 |awk '{print $2}'` #定义内存总大小
mem_use=`free -m|awk NR==2 |awk '{print $3}'` #定义已使用内存
mem_free=`free -m|awk NR==2 |awk '{print $4}'` #定义可用内存
if [ $mem_use -lt 14000 ];then #正常状态
echo "MEM OK: tatol:$mem_tatol"M",used:$mem_use"M",free:$mem_free"M"" #正常状态返回信息,即nagios页面显示的检测结果
exit 0 #正常状态返回代码 0
elif [ $mem_use -gt 14000 ]&&[ $mem_use lt 15500 ];then #告警阈值
echo "MEM WARNING: Mem used is $mem_use"M"." # 紧急状态返回信息
exit 1 # 紧急状态返回代码
else
echo "MEM CRITICAL: Mem used is $mem_use"M"." #紧急 状态返回信息
exit 2 #紧急 状态返回代码
fi
[root@localhost libexec]#