一、简述
通常在正式环境上,需要监控服务器资源的使用情况,当达到使用率超过多少时,进行告警运维人员。
此时用到grafana的Alerting功能,进行定时检查/监控指标。并根据规则去发送警告信息,集成到企业微信/钉钉等办公软件
![](https://img-blog.csdnimg.cn/img_convert/2270e227c7f62907cdb8160917ca841f.png)
二、警告形式
1、添加群机器人
创建一个钉钉/企业微信群-->添加机器人-->添加机器人后,有一个webhook地址
![](https://img-blog.csdnimg.cn/img_convert/8980f8f14d41e6dff1c4bc5c7c56dba4.png)
2、grafana 里面配置告警渠道
2.1、添加告警渠道
![](https://img-blog.csdnimg.cn/img_convert/63fa38ef511aa915c787e7f451136b60.png)
![](https://img-blog.csdnimg.cn/img_convert/c6b4deff4356fefe8631e3349b835f02.png)
2.2、将该告警方式配置为默认方式
![](https://img-blog.csdnimg.cn/img_convert/f698eef9fbcf1a3838cb94474d4f731d.png)
三、具体告警规则配置
1、选定要告警的目标
在监控面板中,点击监控指标的下拉按钮-->选择Edit
![](https://img-blog.csdnimg.cn/img_convert/85509763b37d4aae7d60988d61bc8a8b.png)
2、添加警告规则
点击Edit后,下方出现添加告警规则按钮,点击添加
![](https://img-blog.csdnimg.cn/img_convert/e89c98aac61f6dfb9c453e87e731dba8.png)
3、告警规则配置
![](https://img-blog.csdnimg.cn/img_convert/c274ebf5ae34ad1448d648ff434c22f0.png)
![](https://img-blog.csdnimg.cn/img_convert/8f7248e5c8580804740d518c4aedb2ed.png)
最后点击保存,例如配置的规则是每分钟进行一次检查。当CPU超过3%(具体自己根据需要配置)时,进入pengding状态,持续2分钟超过3%,则会告警通知
添加告警后,可以在列表或者监控面板,查看监控状态
![](https://img-blog.csdnimg.cn/img_convert/d23a2659b973e7bab2a6a63d2fedc7a4.png)
![](https://img-blog.csdnimg.cn/img_convert/d6f0e8cfd5f171adc1ac63a79ed45e2d.png)
![](https://img-blog.csdnimg.cn/img_convert/4e78b9d9a82733f39cd0eb7d6093eca9.png)
![](https://img-blog.csdnimg.cn/img_convert/bb0555b585de1a6b8d8c32ae8df0c9b0.png)
企业微信对应接收到告警通知
![](https://img-blog.csdnimg.cn/img_convert/7a097d503f4af7f79c33534ac91822f5.png)