icon应用性能观测APM背景与概述icon

集指标、请求链路、业务日志于一体的应用系统监控产品,兼容多种开源协议,通过自动捕捉系统拓扑、完整保留关键请求和事故现场,有效缩短故障排查时间,构建全面业务监控体系,为业务稳定性持续保驾护航。

icon应用性能观测APM功能与特点icon

优势一:支持多种开源协议,可实现自建平台低成本平滑迁移。支持语言:Java、Go、PHP、Python、Node、C++等,支持开源协议:Jaeger、SkyWalking、OpenTelemetry、ZikPin等。通过OpenTelemetry转发接入,可双写腾讯云APM和自建平台,实现快速验证,快速迁移。

icon应用性能观测APM功能与特点icon

优势二:相比开源自建,成本更低,功能更加丰富。高性价比:相对开源自建,成本缩减50%以上。功能丰富:应用大屏、应用指标、尾部采样、染色采样、方法栈监控等优势功能。

icon应用性能观测APM功能与特点icon

优势三:支持更多云产品联动性,云产品联动:CLS、SCF、TCM、TEM、CDB、Ckafka等。

icon应用性能观测APM应用场景icon

痛点:云原生微服务模式下,服务调用关系复杂,导致应用故障定位困难。

效率要求越来越高
随着DevOps模式的普及,规划、开发、测试、交付的效率越来越高。
系统更加复杂
微服务架构模式使得应用之间的调用关系变得越来越复杂。
环境动态性增强
容器化的部署模式动态性增强,每个实例的生命周期变得更短。
上下游依赖更多
云原生应用依赖云上的各类产品,上下游变得更多且第三方服务不可追踪。
icon标杆案例-TT语音企业级调用链平台icon

项目背景:趣丸主要产品TT语音,游戏社交领域TOP2。利用开源系统 Jaeger 构建了公司的调用链平台,随着业务量增长,自建系统遇到性能差、成本高和功能弱特点,需要从第三方平台引入调用链平台。

icon标杆案例-TT语音企业级调用链平台 客户痛点icon
性能差
400+应用,平均每天18亿上报量,上报采样5%的情况单个应用1小时内的20条链路数据,查询时间将近20s
成本高
9台32核内存64G硬盘3.2T的机器构成整个ES存储平台由1.5个人力来维护,随着业务量增长,机器成本和维护成本都在急剧增长
功能弱
Jaeger UI 只提供了最基本的链路查询的能力,缺少链路追踪的应用列表,应用拓扑和应用详情等功能
推广难
由于性能,功能等各方面原因,在内部业务推广使用比较困难,各个业务部门有单独自建的趋势,导致企业资源浪费
icon标杆案例-TT语音企业级调用链平台icon
icon标杆案例-TT语音企业级调用链平台icon
 
修改3000台机器上的Jaeger Agent配置。只支持数据写入腾讯云APM,无法保留原来自建系统。方案简单,不满足客户低成本迁移诉求。部署一层nginx反向代理,利用流量复制转发数据。token通过header的方式注入,需要APM实现从header读取token的逻辑。配置复杂,不同协议需要配置不同的路由规则。利用开源的OpenTelemetry Collector组件把数据转发到对应的系统。支持协议众多,客户Jaeger、Zikpin协议都可以直接转发。配置简单,可以统一管理接入token和采样。
icon标杆案例-TT语音企业级调用链平台 低成本迁移方案(2/2)icon
迁移成本低
替换Jaeger Collector,就可以完成调用链平台的切割,一周内完成从测试环境验证到正式环境全量接入
迁移风险可控
支持同时写入自建 Jaeger 和 APM,避免迁移过程中出现问题,待完全验证后再下掉自建Jaeger
维护成本低
客户只需要维护 OpenTelemetry Collector,可以实现自定义采样,统一管理业务接入token,降低业务接入复杂度
效果对比验证
支持同时接入腾讯云APM和友商APM,同时进行功能验证
icon标杆案例-TT语音企业级调用链平台icon

内嵌APM控制台方案,打通客户和腾讯云之间的账号体系(1/2)

icon标杆案例-TT语音企业级调用链平台icon

内嵌APM控制台方案,打通客户和腾讯云之间的账号体系(2/2)。客户内部平台直接嵌入APM控制台,无需登陆腾讯云控制台即可使用APM。对接内部权限系统,同时APM支持标签级权限控制,为业务使用APM平台扫清障碍。

icon标杆案例-TT语音企业级调用链平台icon

挑战:多云场景下已存在物理专线,数据上报到APM平台。方案:通过Private Link实现vpc之间的互通。收益:输出一套多云场景,跨地域场景下数据上报方案。

iconFAQicon
1.应用性能观测客户常见的场景和痛点有哪些?场景A:业务场景大且架构复杂,使用开源协议自建了链路。痛点A:自建的链路监控系统性能差,研发难度高,经常遇到BUG难以维护,导致查询变慢,告警不及时等。场景B:已使用友商产品,微服务架构,应用多。痛点B:指标-链路-日志一体化程度不高,未能与云上其他组件打通,没有端到端打通。场景A:研发系统混合了自研与分包开发,需要验收分包开发部分的质量及后续运维。痛点B:理解分包系统架构成本较高,导致无法快速准确定位到问题。2. 应用性能观测支持的付费模式是?当前仅支持后付费模式,费用由上报量和存储时长两部分组成,根据用户的使用量、地域、所选择的数据存储时长等来进行收费。
3. 应用性能观测支持什么语言?目前应用性能观测已经支持 Java、PHP、Go、Python 和 C++,其他主流语言会在今年内陆续支持。4. 应用性能观测可以监控其他云厂商的集群吗?应用性能观测支持混合部署的场景,您只需要确保 Agent 可触达外网,则可以通过应用性能观测服务提供的外网上报地址来上报服务信息,监控您部署在其他云服务商集群上的应用。5. 探针是否会侵入业务代码?应用性能观测探针不侵入业务代码,对于不同语言,您需要安装 Agent 或者引入对应插件,即可开始监控您的服务。
产品推荐 查看更多>>
    腾讯乐享知识管理解决方案

    腾讯乐享知识管理解决方案,超级管理员定义知识管理人员,构建K吧管理体系;知识管理员明确分类体系,发表权限;K吧管理员执行内容管理,定义访问权限。

    超级管理员定义知识管理人员

    知识管理员明确分类体系

    K吧管理员执行内容管理

    构建K吧管理体系,定义访问权限

    EC六度人和CRM系统专业版

    六度CRM 为您搭建全新的销售模式,连接手机、微信、电话、社交广告等社交与沟通工具,借助大数据和AI技术,帮助销售获得新商机、识别有效客户,加速销售成交,提高销售转化率。通过连接社交平台与工具帮助企业积累数据,完善客户画像,提升企业的数字化运营能力,从而大幅提升营销转化率。

    帮助销售获得新商机、识别有效客户

    加速销售成交,提高销售转化率

    完善客户画像,大幅提升营销转化率

    提升企业的数字化运营能力

    腾讯城市安全应急综合指挥解决方案

    腾讯城市安全应急综合指挥解决方案,基于智能物联感知、数智融合、应用融合、服务融合、身份融合构建应急一体化融合引擎,提供丰富、实时的时空大数据资源,结合政务微信、企业微信和微信的三端触达能力,解决城市安全风险应对面临的感知能力差、实时数据少、协同部门多、现场处置能力弱的难题,实现监测预警更精准、辅助决策更智能、组织救援更高效,打造“韧性城市” 防灾减灾体系,为城市安全发展保驾护航。

    应急管理部门应急指挥救援

    城市安全风险监测预警及应急指挥

    专业部门突发事件应急指挥救援

    打造“韧性城市” 防灾减灾体系