Prometheus监控服务器内存监控
异常现象
监控的centos7使用Prometheus2.5的node_exporter1.6一直收到微信告警信息如下:
然后登陆服务器查询,执行命令free -m,信息如下:
发现:告警信息和实际服务器信息不一致;
处理过程
查询PromQL公式:
ceil(100 - (((node_memory_MemFree_bytes{
job="gtcq-gt-devops-node-exporter"} + node_memory_Buffers_bytes{
job="gtcq-gt-devops-node-exporter"} + node_memory_Cached_bytes{
job="gtcq-gt-devops-node-exporter"}) / node_memory_MemTotal_bytes{
job="gtcq-gt-devops-node-exporter"}) * 100)) > 90
说明:经过验证,以上的PromQL公式不适用于centos7,此公式验证适用于centos6;
修改公式
修改公式如下,查询PromQL公式:
ceil((1 - (node_memory_MemAvailable_bytes{
job="gtcq-gt-devops-node-exporter"} / (node_memory_MemTotal_bytes{
job="gtcq-gt-devops-node-exporter"}))) * 100) >90
说明:这个公式和服务器实际数据还是有些出入,但已经比较接近了,希望有更精准的监控公式可以留言;