可观测产品剖析:业务监控

随着可观测概念的深入推广,各企业内部的监控体系逐渐从传统集中监控向可观测体系转变,指标、日志和链路追踪的监控支柱概念深入人心。观念的转变带来了场景的升级和相应产品的诉求:在基础资源、日志、系统微服务通过工具搭建起完善的观测体系之后,业务层面的可观测也在企业内部提上日程。超越基础资源和系统之间的壁垒,实现真正的业务场景下的运行遥测可视化,是每个企业内部的重要愿景之一。在此背景下,结合市场行业需求,通过深入了解企业实际场景,嘉为蓝鲸全栈智能观测中心·鲸眼推出针对业务运行的观测模块——KBOM产品。

观测场景

无论是银行证券等金融企业,还是能源交通等制造厂商,业务永远是企业内部最重要的生命线,各种复杂繁多的业务场景支撑了一家企业的生命存续,针对业务系统的运行观测成了各大企业的重中之重。业务观测能力整体来说可以分为两大类:运行链路与业务指标。

运行链路代表了业务系统互相之间的调用依赖关系,任何一个环节的故障都有可能成为制约业务平稳发展的关键因素。

业务指标直观反映了业务运行的健康程度,通用的黄金指标如业务请求量、响应耗时、响应率等在各种业务场景下都可以很好地反映业务运行情况。

场景痛点

在云原生理念的推动下,随着IT资源日益向容器化及云平台化转型,业务架构也逐步迈向微服务架构,这一变革使实时场景变得复杂且多变。相应地,运维人员面临的问题愈发难以预测,企业内部往往面临以下痛点:

  • 单一传统监控设计指标、配置阈值,被动告警的监控方案已难以及时响应业务故障,无法更有效地预知业务运行风险;
  • 常见的APM方案又无法解决系统隔离情况下的跨系统调用追踪难题
  • 可观测观念的主旨在于从被动监控向主动观测转变,传统监控工具难以满足主动探索、隐患排查的运维诉求。

解决方案

针对企业内部实际运行的业务场景,KBOM模块可以实现业务架构的拓扑可视化,指标数据的视图化。通过符合通用协议的格式化日志数据或跨系统的链路追踪数据实现业务流的自探测、自生成;结合强大的数据清洗分析能力,实现各种业务指标的清洗分析,并最终通过视图方式进行页面呈现。

产品功能

功能点1:业务看板

全栈智能观测中心业务监控(以下简称“业务监控”)通过数据分析能力,从业务视角展现业务运行黄金指标,并支持通过指标柱颜色反映数据告警状况。支持用户直观查看业务系统关键指标及告警状况。

功能点2:系统看板

从另一视角,业务监控支持各系统独立展现业务运行黄金指标,支持通过指标柱颜色反映数据告警状况;支持用户针对关键系统独立观测,及时发现业务运行隐患。

功能点3:业务拓扑

业务监控可通过格式化数据的汇总分析,自动探测生成业务运行实际调用依赖拓扑。通过拓扑,用户可以直接感知到业务请求的实际运转流向,而不必人工摸索掌握系统庞大复杂的整体架构;与此同时,拓扑中支持直接反映各节点运行健康状况,通过染色标记,用户可以直接关注到瓶颈/故障节点,从而快速便捷地完成业务调试、故障排查等动作。

功能点4:业务详情

用户可通过业务看板/业务拓扑下钻,查看某一具体业务的详细运行状况。

① 场景拓扑

与拓扑页面一致,用户可在拓扑区域查看业务运行实际依赖,支持通过展开节点的方式查看各系统在当前业务场景下的指标汇总数据。

② 指标视图

与业务看板页面一致,支持用户查看任意时段的指标数据,黄金指标集中展示并根据指标告警情况进行染色处理,支持用户点击染色视图一键跳转至告警列表页,查看对应告警详情。

③ 接口列表

汇总业务场景流经的具体接口,从接口层面实现指标数据分析;支持用户根据接口名称或所属系统检索对应数据;同时提供汇总数据,用户可在任意维度切分检索之后查看汇总指标数据。

功能点5:系统详情

① 系统拓扑

联动APM体系,拉取应用运行拓扑,展示系统层面的运行依赖与调用。

② 指标视图

通过黄金指标汇总视图,展示系统运行状况;支持通过染色节点一键跳转至告警列表页,查看对应告警详情;同时展示业务请求饼图,从系统视角观测各业务调用的实际占比。

③ 接口列表

汇总系统对外提供服务的接口信息,深入接口层面实现系统运行状态监测;支持用户根据接口、所属系统等信息进行各维度切分检索。

功能点6:请求链检索

详细记录罗列业务的每一笔请求详情:绘制系统调用瀑布图;通过折线图根据真实请求量实时汇总数据;支持用户通过全局跟踪号、系统调用追踪标记、发起系统、流经系统和响应耗时维度自由组合切分数据,从多种角度观测探索业务运行情况。

功能点7:可观测联动

得益于嘉为蓝鲸一体化可观测平台的理念,业务监控模块支持快速联动跳转各场景页面:

  • 支持通过告警染色、告警汇总跳转告警列表/详情页;
  • 支持通过拓扑节点下钻分析原始日志数据;
  • 支持通过系统详情页面一键跳转对应APM应用分析;
  • 支持通过请求链具体环节下钻至Trace数据分析。

落地愿景

业务监控旨在通过最小化用户系统的改造需求,采用更广泛的技术路径,来降低企业内部业务可观测性的建设成本,并为众多不同类型的企业提供高度适用且用户友好的业务场景可观测解决方案。

微软开源基于 Rust 的 OpenHCL 字节跳动商业化团队模型训练被“投毒”,内部人士称未影响豆包大模型 华为正式发布原生鸿蒙系统 OpenJDK 新提案:将 JDK 大小减少约 25% Node.js 23 正式发布,不再支持 32 位 Windows 系统 Linux 大规模移除疑似俄开发者,开源药丸? QUIC 在高速网络下不够快 RustDesk 远程桌面 Web 客户端 V2 预览 前端开发框架 Svelte 5 发布,历史上最重要的版本 开源日报 | 北大实习生攻击字节AI训练集群;Bitwarden进一步脱离开源;新一代MoE架构;给手机装Linux;英伟达真正的护城河是什么?
{{o.name}}
{{m.name}}

猜你喜欢

转载自my.oschina.net/u/4026796/blog/16027648