之前介绍的Zabbix监控都是属于监控服务方面,现在介绍一下Zabbix监控服务器硬件信息的。
由于我公司服务器都是使用Dell(我公司是手游方面,服务器全部是Dell),服务器型号有r410、r420、r710、r720,系统有Centos 5.x、Centos 6.x 、Redhat 5.x、Redhat 6.x、Ubuntu 12.04、Ubuntu 12.04.4等版本,对于硬件监控,我测试过Ipmi、Megacli、Smart等,但这些监控软件的监控内容都比较少,没有通用的那种,***找到了Dell专门的Omsa,满足了我的需求,下面就介绍一下使用Omsa来监控Dell服务器的硬件信息。
目前我监控以下的硬件信息:
1、cpu处理器状态
2、cpu省电模式状态(如果开启了省电模式,在压力大的时候,会很卡的)
3、raid状态(比如做了哪个raid模式,raid状态是否正常)
4、内存状态(可以查看当前服务器***支持多少内存,当前多少内存,如果内存有问题,可以显示哪个位置内存故障)
5、机器温度状态(监控机器的温度是否超过阀值)
6、物理硬盘状态(监控物理硬盘是否有故障)
7、电源状态(是单电还是双电,是否有故障)
8、系统面板CMOS电池(cmos电池是否有故障)
9、网卡状态(当前的网卡数量,以及网卡是否有问题)
10、风扇(当前的风扇数量,以及是否有故障)
默认是cpu省电模式监控关闭报警,其他的监控都是15分钟监控一次,如果连续2次都有问题则报警通知。
下面是监控图
1、硬件正常的服务器监控截图
2、部分硬件不正常的监控图
可以看到此服务器的cpu开启了省电模式,并且内存条有问题
经过命令行查看,发现有问题的内存条是***个插槽
下面是安装方法:
一、客户端
A.在redhat或者centos系统里安装
1、安装dell的yum源
wget-q-O-http://linux.dell.com/repo/hardware/latest/bootstrap.cgi|bash
2、安装omsa
yuminstallsrvadmin-all
3、做软连接
ln-s/opt/dell/srvadmin/sbin/omreport/usr/bin/omreport ln-s/opt/dell/srvadmin/sbin/omconfig/usr/bin/omconfig
4、关闭web模式(仅允许运行cli)
echo"/usr/bin/omconfigsystemwebserveraction=stop">>/opt/dell/srvadmin/sbin/srvadmin-services.sh
5、启动omsa
/opt/dell/srvadmin/sbin/srvadmin-services.shstart
6、把omsa加入到开机启动里
echo"/opt/dell/srvadmin/sbin/srvadmin-services.shstart">>/etc/rc.local
以上是在centos或者redhat系统里安装omsa。
B.下面是在ubuntu下的安装
1、增加源
echo'debhttp://linux.dell.com/repo/community/ubuntupreciseopenmanage'|sudotee-a/etc/apt/sources.list.d/linux.dell.com.sources.list
2、检测与增加key
gpg--keyserverpool.sks-keyservers.net--recv-key1285491434D8786F gpg-a--export1285491434D8786F|sudoapt-keyadd-
3、更新源
apt-getupdate-y
4、安装omsa
apt-getinstallsrvadmin-all-y
5、做软连接
ln-s/opt/dell/srvadmin/sbin/omreport/usr/bin/omreport ln-s/opt/dell/srvadmin/sbin/omconfig/usr/bin/omconfig
6、启动cli模式omsa
servicedataengstart
C.zabbix客户端的配置
1、下面是在zabbix_agentd.conf里配置
#followismonitorhardware UserParameter=hardware_battery,omreportchassisbatteries|awk'/^Status/{if($NF=="Ok"){print1}else{print0}}' UserParameter=hardware_cpu_model,awk-vhardware_cpu_crontol=`sudoomreportchassisbiossetup|awk'/CState/{if($NF=="Enabled"){print0}else{print1}}'`-vhardware_cpu_c1=`sudoomreportchassisbiossetup|awk'/C1[-|E]/{if($NF=="Enabled"){print0}else{print1}}'`'BEGIN{if(hardware_cpu_crontol==0&&hardware_cpu_c1==0){print0}else{print1}}' UserParameter=hardware_fan_health,awk-vhardware_fan_number=`omreportchassisfans|grep-c"^Index"`-vhardware_fan=`omreportchassisfans|awk'/^Status/{if($NF=="Ok")count+=1}END{printcount}'`'BEGIN{if(hardware_fan_number==hardware_fan){print1}else{print0}}' UserParameter=hardware_memory_health,awk-vhardware_memory=`omreportchassismemory|awk'/^Health/{print$NF}'`'BEGIN{if(hardware_memory=="Ok"){print1}else{print0}}' UserParameter=hardware_nic_health,awk-vhardware_nic_number=`omreportchassisnics|grep-c"InterfaceName"`-vhardware_nic=`omreportchassisnics|awk'/^ConnectionStatus/{print$NF}'|wc-l`'BEGIN{if(hardware_nic_number==hardware_nic){print1}else{print0}}' UserParameter=hardware_cpu,omreportchassisprocessors|awk'/^Health/{if($NF=="Ok"){print1}else{print0}}' UserParameter=hardware_power_health,awk-vhardware_power_number=`omreportchassispwrsupplies|grep-c"Index"`-vhardware_power=`omreportchassispwrsupplies|awk'/^Status/{if($NF=="Ok")count+=1}END{printcount}'`'BEGIN{if(hardware_power_number==hardware_power){print1}else{print0}}' UserParameter=hardware_temp,omreportchassistemps|awk'/^Status/{if($NF=="Ok"){print1}else{print0}}'|head-n1 UserParameter=hardware_physics_health,awk-vhardware_physics_disk_number=`omreportstoragepdiskcontroller=0|grep-c"^ID"`-vhardware_physics_disk=`omreportstoragepdiskcontroller=0|awk'/^Status/{if($NF=="Ok")count+=1}END{printcount}'`'BEGIN{if(hardware_physics_disk_number==hardware_physics_disk){print1}else{print0}}' UserParameter=hardware_virtual_health,awk-vhardware_virtual_disk_number=`omreportstoragevdiskcontroller=0|grep-c"^ID"`-vhardware_virtual_disk=`omreportstoragevdiskcontroller=0|awk'/^Status/{if($NF=="Ok")count+=1}END{printcount}'`'BEGIN{if(hardware_virtual_disk_number==hardware_virtual_disk){print1}else{print0}}'
2、重启zabbix_agentd服务
ps-ef|grepzabbix|grep-vgrep|awk'{print$2}'|xargskill-9 /usr/local/zabbix/sbin/zabbix_agentd-c/usr/local/zabbix/conf/zabbix_agentd.conf
如果需要在其他系统里安装,请参看官方wiki,地址是http://linux.dell.com/wiki/index.php/Repository/hardware。
二、服务端
1、模板导入
把Template Hardware Monitor导入到zabbix里(模板在附件),具体操作不介绍。
2、主机关联模板
把需要监控的硬件服务器关联此模板即可