1 监控目的
(1)部署服务众多,问题排查复杂
公司服务器目前部署了java程序、mysql数据库、nodejs程序、redis、kafka、zookeeper,以及其他三方工具包含nacos网关、kkfileview插件等;
(2)服务器多,难以统一管理
公司目前有5台服务器,分别有云服务器、机房服务器,各服务器部署服务及系统各不相同。
(3)提前预警保障服务稳定运行
需要分析服务器内存情况,及java服务是否有内存溢出的情况、kafka消费情况,mysql慢日志情况等。
2监控对象
(1)硬件机器
cpu、内存、磁盘占用情况,网络通信情况
(2)java软件
jvm情况,java服务运行情况
(3)消息队列及缓存
kafka队列及消费情况、redis内存占用情况、redis的key-value存储情况。
(4)数据库
数据库慢sql情况、数据库sql语句执行记录、sql报错记录。
3监控方案
(1)Zabbix
1 系统硬件:CPU、内存、磁盘的利用率等 2:可以监控应用服务:apache、nginx、tomcat、mysql 状态等 3 可以监控网络:交换机啊、入口出口流量负载啊等 4 可以监控日志:系统的日志,web 各种服务的日志、访问日志,报错的日志等。
(2)kafka-ui-lite开源项目
- kafka ui界面客户端工具,可以在生产消息、消费消息、管理topic、管理group;可以支持管理多个kafka集群
- 部署简便,不需要连数据库,只有一个jar包启动即可
- 支持zookeeper ui界面化操作;支持多环境管理
- 支持redis ui界面化操作;支持多环境管理
具体链接地址