部署Nagios监控系统二
在第一部分(https://www.roamway.com/?p=481)经过环境配置 ,Nagios界面已出现。
这部分开始服务端和客户端的配置,形成基本的监控界面。
linux客户端
1.添加nagios用户
useradd -s /usr/sbin/nologin nagios
2.安装nagios-plugins-1.4.14
./configure
make && make install
3.更改目录属性
chown -R nagios:nagios /usr/local/nagios/
4.安装nrpe-2.12
./configure
make all
make install-daemon
make install-daemon-config
5.安装xinetd脚本
make install-xinetd
6.编辑nrpe配置文件
vim /usr/local/nagios/etc/nrpe.cfg
找到#service_address=127.0.0.1,将前面的#去掉并将127.0.0.1改为本机地址192.168.17.55
Allowed_hosts=127.0.0.1后面添加监控服务器的ip,用逗号隔开
保存退出
7.编辑nrpe文件
vim /etc/xinetd.d/nrpe
在only_from = 127.0.0.1后面添加192.168.18.7,ip之间用逗号隔开
保存退出
8.编辑/etc/services文件,增加nrpe服务
vim /etc/services
9.重启xinetd服务
/etc/init.d/xinetd restart
10.编辑nrpe配置文件
vim /usr/local/nagios/etc/nrpe.cfg
在本文件的配置信息中添加如下内容
command[check_users_1]=/usr/local/nagios/libexec/check_users –w 5 –c 10
command[check_load_1]=/usr/local/nagios/libexec/check_load –w 15,10,5 –c 30,25,20
chmmand[check_sda4_1]=/usr/local/nagios/libexec/check_disk –w 20% -c 10% -p /dev/sda4
command[check_zombie_procs_1]=/usr/local/nagios/libexec/check_procs –w 5 –c 10 –s Z
command[check_total_procs_1]=/usr/local/nagios/libexec/check_procs –w 150 –c 200
command[check_swap_1]=/usr/local/nagios/libexec/check_swap –w 20 –c 10
保存退出
11.防火墙开放TCP 5666端口,并且关闭selinux
12.启动nrpe守护进程
/usr/local/nagios/bin/nrpe –c /usr/local/nagios/etc/nrpe.cfg -d
13. /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 这里提示连接被拒绝
这个问题先放在这里,后面解决。
服务端:
1.安装nrpe-2.12
./configure
make all
make install
2.执行/usr/local/nagios/libexec/check_nrpe –H 192.168.17.55,出现版本号,则服务端和客户端正常通信。
3.编辑commands.cfg
vim /usr/local/nagios/etc/objects/commands.cfg
在commands.cfg中添加如下的内容。
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe –H $HOSTADDRESS$ -c $ARG1$
}
保存退出
4.编辑services.cfg
vim /usr/local/nagios/etc/objects/services.cfg
如果没有services.cfg需要自己创建
将下面的内容粘贴进去
define service{
host_name 192.168.17.55
service_description users
check_command check_nrpe!check_users_1
}
define service{
host_name 192.168.17.55
service_description load
check_command check_nrpe!check_load_1
}
define service{
host_name 192.168.17.55
service_description sda5
check_command check_nrpe!check_sda5_1
}
define service{
host_name 192.168.17.55
service_description zombie process
check_command check_nrpe!check_zombie_procs_1
}
define service{
host_name 192.168.17.55
service_description total process
check_command check_nrpe!check_total_procs_1
}
保存退出
5.编辑hosts.cfg
此文件默认是不存在的,需要手动创建
vim /usr/local/nagios/etc/objects/hosts.cfg
将下面的内容粘贴进去
define host {
host_name 192.168.18.7
alias 1 92.168.18.7
address 192.168.18.7
contact_groups sagroup
check_command check-host-alive
max_check_attempts 5
notification_interval 10
notification_period 24×7
notification_options d,u,r
}
define host {
host_name 192.168.17.55
alias 192.168.17.55
address 192.168.17.55
contact_groups sagroup
check_command check-host-alive
max_check_attempts 5
notification_interval 10
notification_period 24×7
notification_options d,u,r
}
保存退出
6.编辑nagios.cfg
vim /usr/local/nagios/etc/nagios.cfg/nagios.cfg
在nagios.cfg文件中添加如下信息,也就是将刚才创建的hosts.cfg和services.cfg在nagios.cfg文件中做声明。
cfg_file=/usr/local/nagios/etc/objects/hosts.cfg
cfg_file=/usr/local/nagios/etc/objects/services.cfg
保存退出
7.检查配置文件的正确性
/etc/init.d/nagios stop
/usr/local/nagios/bin/nagios –v /usr/local/nagios/etc/nagios.cfg 检查配置文件的正确性。
8.启动nagios
/usr/local/nagios/bin/nagios /usr/local/nagios/etc/nagios.cfg –d
9.浏览器键入http://192.168.18.7/nagios 可以看到监控界面了。
至此主机监控状态界面已经出现,但有许多异常。后续会做进一步调整使监控恢复正常。