使用 process-exporter 监控进程,node-expoert 监控节点
- 获取每个进程的内存使用量的表达式为
node_process_namegroup_memory_bytes{job="process",ip="10.1.1.1",memtype="resident"}
- 获取节点总内存量的表达式为
node_memory_MemTotal_bytes{job="node",ip="10.1.1.1"}
如果想计算每个进程的内存使用率,简单地将二者相除是得不到结果的,正确的计算表达式为 node_process_namegroup_memory_bytes{job="process",ip="10.1.1.1",memtype="resident"} / on(ip) group_left() node_memory_MemTotal_bytes{job="node",ip="10.1.1.1"}
on(ip)
用于向量匹配,也就是除法运算符左右两侧的表达式中通过 ip
标签来匹配,两边的 ip
相等的才会进行运算。group_left
用于多对一匹配,左侧会有多个值,即每个进程的内存使用量,而右侧只有一个值,即节点的内存总量,要实现左右两侧的运算,要通过 group_left()
表示多对一的关系,即左侧每个值都逐一与右侧的值进行运算。group_left()
的参数是右侧的标签名,其会将此标签值传递给左侧,也就是出现在运算的结果中,并且覆盖左侧同名标签。比如此例中如果 group_left(job)
,那么最终结果的标签集中将会存在 job="node"
而不是 job="process"
。