当我们需要获取某台主机上的数据时,直接利用 zabbix 提供的模板可以很方便的获得需要的数据,但是有些特别的数据,利用这些现有的模板或监控项是无法实现的,例如网站状态信息的监控、mysql数据库主从状态等信息。这是就需要自己定义键值和监控项,以满足企业对检测数据的需要。

一、什么是zabbix的key值

        Zabbix 中内置了很多监控参数(Key),我们可以通过在客户端配置文件中定义 key,获取监控对象中的系统、CPU、网络、内存、文件系统等信息。
        Key(键)是 zabbix 标记 item 的键,是一种标识符。利用 key 可以定义一个监控对象,那么这个监控对象肯定是采集数据的,但是采集数据的时候可能存在很多节点与 server 交互,那么需要具体采集哪个节点,就可以用 key 进行采集。

二、获取远程 key 值

1.获得主机的 key 值

        监控项(Itens)就是监控指标获取数据的方式、数据类型、更新数据的时间间隔、历史数据保留时间、趋势数据保留时间、监控项的分组等指标。另外一个概念是监控指标,用 key 表示,它是构成监控项的一个元素,在一个主机/模板中必须是唯一的。
        zabbix agent 是利用 key 值获取主机监控数据的,在每个 agent 端的监控项上,都可以找到 zabbix客户端对应的许多 key 值。
        “数据采集”-->“主机”-->“监控项”,可以看到每台主机的监控项中,为了采集对应的主机信息,都有一个键值,利用这个键值,Zabbix就可以获取对应的数据。

2.zabbix get 命令获取 Agent 数据举例

(1)zabbix get 获取 cpu 核心数
[root@ZBX ~]# zabbix get -s 192.168.10.101 -k system.cpu.num
1
(2)获取目标主机系统和内核版本等参数
[root@ZBX ~]# zabbix get -s 192.168.10.101 -k system.unameLinux localhost,localdomain 3,10,0-1160.e17.x86 64 #1 SMP Mon Oct 19 16:18:59 UTC 2020x86 64
(3)查看目标主机端口是否开启
[root@zBX ~]# zabbix_get -s 192.168.10.101 -k net.tcp.port[,22]
1

备注:
1 为开启,0 为关闭

(4)查看进程是否开启
[root@ZBX ~]# zabbix get -s 192.168.10.101 -k proc.num[sshd]
9

备注:

如果开启,显示对应的进程数

(5)查看进程是否开启
[root@ZBX ~]# zabbix get -s 192.168.10.101 -k proc.num[sshd]
9

备注:
如果开启,显示对应的进程数

(6)查看磁盘剩余空间
[root@ZBX ~]# zabbix get -s 192.168.10.101 -p 10050 -k vfs.fs.size[/,pfree]
97.051317
(7)查看当前网卡流量
[root@ZBX ~]# zabbix_get -s 192.168.10.101 -k net.if.out[ens33,bytes]
796888

备注:
在不同时间执行两次这个命令,用后面的减去前面的,除以两者之间的时间,得到速率

(8)获取目标主机内存值
[root@ZBX ~]# zabbix get -s 192.168.10.101 -p 10050 -k vm.memory.size[total]
3953934336

备注:
获取目标主机内存值

三、Zabbix 自定义 key 值

        使用 zabbix agent 自带的 key 值,我们已经可以监控到很多数据了,但是仍然有一些数据,是 agent的 key 值没有的。对于这些特殊的需求,就要求我们自己定义 key 值。

1.添加Nginx模块添加

[root@server01 ~]# yum -y install nginx
root@server01 ~l# cd /etc/nginx/
root@server01 ~]# cp nginx.conf.default nginx.conf
(1)添加 nginx status 模块
[root@server01 ~l# vim /etc/nginx/nginx.conf

[root@server01 ~]# echo "test"> /usr/share/nginx/html/index.html
[root@server01 ~l# systemctl start nginx

2.测试是否能够获取到 Nginx 状态

[root@server01 ~]# curl 127.0.0.1/nginx status
Active connections:1
server accepts handled requests
1 1 1
Reading:0 Writing:1 Waiting:0

备注:
Active connections :Nginx正处理的活动链接数1个。

server :
        accepts:Nginx 启动到现在共处理了16449个连接。
        handled:Nginx启动到现在共成功创建16449次握手。
        requests:Nginx 总共处理了15422 次请求。
Reading :Nginx 读取到客户端的 Header 信息数

Writing :Nginx 返回给客户端的 Header 信息数

Waiting :Nginx 已经处理完正在等候下一次请求指令的驻留链接,开启。

3.添加监控脚本

(1)添加脚本
[root@server01 ~]# vim /etc/zabbix/nginx-status.sh
#/bin/bash 
NGINX_PORT=80 
NGINX_COMMAND=$1 
nginx_active(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Active/ {print $NF}' 
}
nginx_reading(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Reading/ {print $2}' 
}
nginx_writing(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Writing/ {print $4}' 
}
nginx_waiting(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Waiting/ {print $6}'
}
nginx_accepts(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk 'NR==3 {print $1}' 
}
nginx_handled(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk 'NR==3 {print $2}' 
}
nginx_requests(){ 
/usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk 'NR==3 {print $3}' 
}
case $NGINX_COMMAND in 
active) 
nginx_active; 
;; 
reading) 
nginx_reading; 
;; 
writing) 
nginx_writing; 
;; 
waiting) 
nginx_waiting; 
;; 
accepts) 
nginx_accepts; 
;; 
handled) 
nginx_handled; 
;; 
requests) 
nginx_requests; 
;; 
*) 
echo $"USAGE:$0 {active|reading|writing|waiting|accepts|handled|requests}" 
esac 

[root@server01 ~]# chmod+x /etc/zabbix/nginx-status.sh

4.修改 agent 端参数以支持自定义 key 值

[root@server01 ~]# vim /etc/zabbix/zabbix agentd.confUnsafe
UserParameters=1
UserParameter=nginx status[*],/etc/zabbix/nginx-status.sh $1

备注:
UnsafeUserParameters=1:启用自定义key功能

UserParameter:指定脚本
        nginx_status 为 key 值名称。[*]里写脚本参数,没有可以不写。/etc/zabbix/nginx-status.sh $1 路径为脚本所在路径。

[root@server01 ~l# systemctl restart zabbix-agent

5.Zabbix_get 测试

[root@zabbix ~]# zabbix get -s 192.168.10.101 -k nginx status[accepts]

6.Zabbix Web 端添加监控

(1)添加模板

“数据采集”-->“模板”-->“创建模板”,创建一个名为 Nginx 状态的模板

(2)为模板添加监控项

        点击“数据采集”,再点击“模板”选项后,找到刚刚创建名为 Nginx 状态的模板,点击“监控项后,再点击“创建监控项”按钮,创建出如下监控项。

添加监控项
监控项        nginx active        键值为        nginx status[active]
监控项        nginx reading        键值为        nginx status[reading]
监控项        nginx writing        键值为        nginx status[writing]

监控项        nginx waiting        键值为        nginx status[waiting]
监控项        nginx accepts        键值为        nginx status[accepts]
监控项        nginx handled        键值为        nginx status[handled]
监控项        nginx requests        键值为        nginx status[requests]

 

7.验证自定义监控

(1)为主机关联新创建的模板

“数据采集”-->“主机”,为该主机关联刚才创建的模板。

(2)为该主机添加新的监控图形

“数据采集”-->“主机”-->“图形”,创建 nginx active 图形
备注:
其他监控项的图形创建方法一样,此处不在一一列举。

 (3)验证自定义监控数据和图形

“检测”-->“主机”,査看 server01 的检测数据,以及新添加的图形。

8.为 nginx 监控创建触发器及邮件报警测试

(1)为模板添加触发器

        点击“数据采集”按钮,再点击“模板”选项,然后点击“nginx-status”模板,选择“触发器选项,点击“创建触发器”按钮
        添加表达式,点击“添加”按钮,在弹出界面里监控项选择 nginx 主机 的“nginx active监控项,功能选择“last-最后(最近)的 T 值,结果大于 N”,N 填写“5”,再点击“插入”按钮。这里的意思是当 Nginx 的活动连接大于 5 时,触发报警。

        注意:由于是实验环境,这里 N可以设置的小一些,便于验证结果,在生产环境中可以根据需求更改。

(2)添加告警动作和操作

“告警”-->“动作”-->“触发器动作”,点击创建动作按钮。

添加触发条件,条件选项触发器,并指定上一步中创建的触发器。

设置触发器的操作,指定触发后发送报警信息的接收用户。

(3)触发报警

模拟多个用户访问网站,使得连接数大于前面设定的报警阈值,并观察邮箱的报警邮件

备注:
小技巧:写个无限访问小脚本,在多台主机上执行此脚本,即可模拟出多个用户的连接。

cat <<EOF>fangwenjiaoben.sh
while true
do
curl 192.168.10.101
done
EOF

四、监控 MySQL 主从复制

1.部署 mysq1 主从复制

(1)在两台主机(103 和 104)上安装
[root@server01 ~]# yum -y install mariadb-server mysql
(2)主机103当master
[root@server01 ~]# vim /etc/my.cnf
[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
server-id=11
log-bin=master-bin
[root@server01 ~]# systemctl start mariadb
[root@server01 ~]# mysqladmin -uroot password 'pwd123'
[root@server01 ~]# mysql:-uroot -ppwd123
MariaDB [(none)>grant replication slave on *.*to root@'%'identified by'pwd123';
MariaDB [(none)>show master status;

(3)主机 104当slave
[root@server02 ~]# vim /etc/my.cnf
[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
server-id=22
[root@server02 ~]# systemctl start mariadb
[root@server02 ~]# mysqladmin -uroot password'pwd123
[root@server02 ~]# mysql -uroot -ppwd123
MariaDB [(none)]> change master to
master host='192.168.10.101',master user='root',master password='pwd123',master logfile='master-bin.000001',master log pos=385;
MariaDB [(none)]> start slave;
MariaDB [(none)]> show slave status\G
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event
                  Master_Host: 192.168.10.101
                  Master_User: root
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: master-bin.000003
          Read_Master_Log_Pos: 522
               Relay_Log_File: mariadb-relay-bin.000003
                Relay_Log_Pos: 530
        Relay_Master_Log_File: master-bin.000003
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB: 
          Replicate_Ignore_DB: 
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 0
                   Last_Error: 
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 522
              Relay_Log_Space: 1111
              Until_Condition: None
               Until_Log_File: 
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
           Master_SSL_CA_File: 
           Master_SSL_CA_Path: 
              Master_SSL_Cert: 
            Master_SSL_Cipher: 
               Master_SSL_Key: 
        Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0
                Last_IO_Error: 
               Last_SQL_Errno: 0
               Last_SQL_Error: 
  Replicate_Ignore_Server_Ids: 
             Master_Server_Id: 11
1 row in set (0.00 sec)

2.MySQL-slave 端开启自定义 key 值并设置

[root@server02 ~]# vim /etc/zabbix/zabbix agentd.conf
UnsafeUserParameters=1
UserParameter=mysql.slave[*],/etc/zabbix/mysql-slave.sh

3.编写脚本获取数据

[root@server02 ~]# vim /etc/zabbix/mysql-slave.sh
#!/bin/bash
/usr/bin/mysql-ppwd123-uroot"showslavestatus\G'grep-E-e"slave Io Runninglslave SoL Running" awk '{print $2}'grep -c Yes
[root@server02 ~]# chmod +x /etc/zabbix/mysql-slave.sh
[root@server02 ~]# systemctl restart zabbix-agent

4.Zabbix get 测试

[root@zabbix ~]# zabbix get -s 192.168.10.102 -k mysql.slave[*]
2

备注:
Slave_IO_ Runningt 和Slave_SoL_Running 返回的yes 值为2

5.添加监控模板

“数据采集”-->“模板”,再点击“创建模板”按钮,进行创建模板操作。

6.为模板添加监控项

“数据采集”-->“模板”,点击刚才创建的模板,为此模板添加“监控项”信息,名称输入“mysql-slave”键值输入“mysql.slave[*]”,然后点击“添加”按钮。

7.为主机关联模板

为 server02 主机关联刚才创建的监控模板

8.为模板添加触发器

        "数据采集”-->“模板”,找到刚才创建的模板 mysql-slave,点击“触发器”,再点击“创建触发器”。

        在监控项中点击“选择”按钮,选择前面创建的 mysql-slave 监控项,在功能处点击下拉菜单,选择“last-最后(最近)的 T 值”,结果为<N 下面 N 中输入 2,然后点击“插入”按钮。

(1)添加告警动作和操作

“告警”-->“动作”-->“触发器动作”

条件选项触发器,并指定上一步中创建的触发器

9.测试

关闭 mysq1 从节点的 slave 进程

[root@server02 ~]# mysql -uroot -ppwd123
MariaDB [(none)l>stop slave;

观察报警信息

五、监控网站关键词

监控网站关键词与监控 Nginx 大致相同,都是编写检索字段的脚本,然后 web 端添加监控。

1.创建测试页面

[root@server01 ~]# vim /usr/share/nginx/html/index.html
<html>
<body>
<p>nihao 黄 nihao</p>
<p>nihao 赌 nihao</p>
<p>nihao 毒 nihao</p>
</body>
</html>

2.编写检索脚本

[root@server01 ~]#vim /etc/zabbix/gic.sh
#/bin/bash
curl -s http://192.168.10,101/index.htmllgrep -e 黄-e赌-e毒lwc -l
[root@server01 ~]# chmod +x /etc/zabbix/gjc.sh

3.开启 Agent 的自定义 key 值

[root@server01 ~]# vim /etc/zabbix/zabbix agentd.conf
UnsafeUserParameters=1
UserParameter=nginx gjc*l,/etc/zabbix/gjc.sh
[root@server01 ~]# systemctl restart zabbix-agent

4.在管理界面添加模板

“数据采集”-->“模板”,点击创建模板,在此界面配置“关键词检索模板”,添加模板相关信息。

5.为模板添加监控项

“数据采集”-->“模板”,找到刚才创建的模板,点击它的监控项,并创建监控项,键值为 nginx_gjc。

6.将模板关联到主机

“数据采集”-->“主机”,找到 nginx 的服务器,为此主机关联刚才创建的模板。

7.为模板添加触发器

“数据采集”-->“模板”,找到此模板,点击它的触发器,为此模板创建触发器。

8.Zabbix_get 测试

[root@zBX ~]# zabbix get -s 192.168.10.101 -k nginx gjc[*]
3

9.添加告警动作和操作

告警-->动作-->触发器动作,创建 server01 的告警动作和操作。

10.查看触发的告警信息

注意:
如果有告警信息,但是不发送邮件,可以先把nginx 关掉,再打开,重新触发一。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐