深入 Prometheus 监控生态 - 第四篇:服务器硬件信息监控(ipmi-exporter)
IPMI监控基于IPMI协议,允许对物理服务器的硬件进行低级别管理。IPMI Exporter通过与BMC(Baseboard Management Controller)通信,获取服务器的硬件状态,如温度、风扇、电压等,将这些数据转化为Prometheus的格式。因为 Prometheus 在 dockerhub 上面没 ipmi-exporter 容器镜像,那就自己做一个呗。下面就以基础镜像为
前言
IPMI监控基于IPMI协议,允许对物理服务器的硬件进行低级别管理。IPMI Exporter通过与BMC(Baseboard Management Controller)通信,获取服务器的硬件状态,如温度、风扇、电压等,将这些数据转化为Prometheus的格式。
因为 Prometheus 在 dockerhub 上面没 ipmi-exporter 容器镜像,那就自己做一个呗。
下面就以 Ubuntu Docker Image 基础镜像为例子,部署 node-exporter 并进行监控。
一、下载ipmi_exporter
下载 prometheus ipmi_exporter (github) 官方工具
找到自己所对应版本,比如我这里下的是 ipmi_exporter-1.8.0.linux-amd64.tar.gz
解压后发现就两个文件 ipmi_exporter 和 LICENSE ,ipmi_exporter 就是运行程序,若想直接启动,命令:
./ipmi_exporter
#或
sh ipmi_exporter
若访问不了 github ,这已经打包好了,下载解压找到对应版本就行:
ipmi-exporter-1.7.0 集合包
ipmi-exporter-1.8.0 集合包
二、docker image制作
编写 Dockerfile ,内容如下:
# 使用 Ubuntu 20.04 作为基础镜像
FROM ubuntu:20.04
# 维护者信息 可加可不加
LABEL maintainer="your_email@example.com"
# 将本地的 ipmi_exporter-1.8.0.linux-amd64.tar.gz 文件拷贝到镜像中
COPY ipmi_exporter-1.8.0.linux-amd64.tar.gz /tmp/
# 解压 ipmi_exporter 文件并将其移动到 /usr/local/bin
RUN tar -xvzf /tmp/ipmi_exporter-1.8.0.linux-amd64.tar.gz -C /tmp/ \
&& mv /tmp/ipmi_exporter-1.8.0.linux-amd64/ipmi_exporter /usr/local/bin/ \
&& rm -rf /tmp/ipmi_exporter-1.8.0.linux-amd64*
# 暴露 9290 端口,用于 IPMI Exporter 的访问
EXPOSE 9290
# 设置容器启动时的默认命令,运行 IPMI Exporter 并监听所有接口的 9290 端口
CMD ["/usr/local/bin/ipmi_exporter", "--web.listen-address=:9290"]
docker build 镜像:
docker build . -t ubuntu:20.04-ipmi_exporter1.8.0t
没报错就是成功,有异常的话会指向第几句和错误原因。
PS:我这里给镜像叫 ubuntu:20.04-ipmi_exporter1.8.0t ,这里大家按自己喜好来命名就好了
三、测试
docker run 运行:
docker run -it -d --privileged --name ipmi -p 9290:9290 ubuntu:20.04-ipmi_exporter1.8.0t
浏览器访问 http://<ipmi-exporter_IP>:9290/metrics ,看到有很多数据就成功部署了
PS:–privileged 参数必须加,是用于授予容器更多权限,使它能够访问主机的所有设备和硬件资源。
不然的话,很多硬件信息会获取不到
–privileged 对应 Kubernetes 里的 Deployment.yaml/DaemonSet.yaml 就是在 spec:containers 下追加:
securityContext:
privileged: true # 开启特权模式
四、加入监控
修改普罗米修斯的 /etc/prometheus/prometheus.rules 文件,追加如下内容并重启服务。
scrape_configs:
- job_name: 'ipmi-exporter'
static_configs:
- targets: ['<ipmi-exporter-ip>:9290'] # 替换为实际的 IP 地址和端口
在浏览器访问 Prometheus ,点击 “Status” → “Targets” 中若能发现 “ipmi-exporter” 栏,且设备数量对得上,State 为 UP,则代表已接入普罗米修斯监控了。
四、监控进阶
将 K8s 所有 node节点(含新加 k8s 的节点)都自动部署 ipmi-exporter 并进行 Prometheus 监控。
请参考 :Prometheus(普罗米修斯)监控系统 - 3、操作系统信息监控(node-exporter) 四、监控进阶 篇章
其中的 yaml 写法 和 实现原理 大体一致
总结
报警规则、看板制作、消息推送,由后面的更新的Prometheus+Grafana的部署篇章中会详细说明。
目前,已更新的所有普罗米修斯及其相关篇章:
Prometheus(普罗米修斯)监控系统 - 1、基本原理
Prometheus(普罗米修斯)监控系统 - 2、网络等硬件设备监控(snmp-exporter)
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)