icon应用性能观测APM背景与概述icon

集指标、请求链路、业务日志于一体的应用系统监控产品,兼容多种开源协议,通过自动捕捉系统拓扑、完整保留关键请求和事故现场,有效缩短故障排查时间,构建全面业务监控体系,为业务稳定性持续保驾护航。

icon应用性能观测APM功能与特点icon

优势一:支持多种开源协议,可实现自建平台低成本平滑迁移。支持语言:Java、Go、PHP、Python、Node、C++等,支持开源协议:Jaeger、SkyWalking、OpenTelemetry、ZikPin等。通过OpenTelemetry转发接入,可双写腾讯云APM和自建平台,实现快速验证,快速迁移。

icon应用性能观测APM功能与特点icon

优势二:相比开源自建,成本更低,功能更加丰富。高性价比:相对开源自建,成本缩减50%以上。功能丰富:应用大屏、应用指标、尾部采样、染色采样、方法栈监控等优势功能。

icon应用性能观测APM功能与特点icon

优势三:支持更多云产品联动性,云产品联动:CLS、SCF、TCM、TEM、CDB、Ckafka等。

icon应用性能观测APM应用场景icon

痛点:云原生微服务模式下,服务调用关系复杂,导致应用故障定位困难。

效率要求越来越高
随着DevOps模式的普及,规划、开发、测试、交付的效率越来越高。
系统更加复杂
微服务架构模式使得应用之间的调用关系变得越来越复杂。
环境动态性增强
容器化的部署模式动态性增强,每个实例的生命周期变得更短。
上下游依赖更多
云原生应用依赖云上的各类产品,上下游变得更多且第三方服务不可追踪。
icon标杆案例-TT语音企业级调用链平台icon

项目背景:趣丸主要产品TT语音,游戏社交领域TOP2。利用开源系统 Jaeger 构建了公司的调用链平台,随着业务量增长,自建系统遇到性能差、成本高和功能弱特点,需要从第三方平台引入调用链平台。

icon标杆案例-TT语音企业级调用链平台 客户痛点icon
性能差
400+应用,平均每天18亿上报量,上报采样5%的情况单个应用1小时内的20条链路数据,查询时间将近20s
成本高
9台32核内存64G硬盘3.2T的机器构成整个ES存储平台由1.5个人力来维护,随着业务量增长,机器成本和维护成本都在急剧增长
功能弱
Jaeger UI 只提供了最基本的链路查询的能力,缺少链路追踪的应用列表,应用拓扑和应用详情等功能
推广难
由于性能,功能等各方面原因,在内部业务推广使用比较困难,各个业务部门有单独自建的趋势,导致企业资源浪费
icon标杆案例-TT语音企业级调用链平台icon
icon标杆案例-TT语音企业级调用链平台icon
 
修改3000台机器上的Jaeger Agent配置。只支持数据写入腾讯云APM,无法保留原来自建系统。方案简单,不满足客户低成本迁移诉求。部署一层nginx反向代理,利用流量复制转发数据。token通过header的方式注入,需要APM实现从header读取token的逻辑。配置复杂,不同协议需要配置不同的路由规则。利用开源的OpenTelemetry Collector组件把数据转发到对应的系统。支持协议众多,客户Jaeger、Zikpin协议都可以直接转发。配置简单,可以统一管理接入token和采样。
icon标杆案例-TT语音企业级调用链平台 低成本迁移方案(2/2)icon
迁移成本低
替换Jaeger Collector,就可以完成调用链平台的切割,一周内完成从测试环境验证到正式环境全量接入
迁移风险可控
支持同时写入自建 Jaeger 和 APM,避免迁移过程中出现问题,待完全验证后再下掉自建Jaeger
维护成本低
客户只需要维护 OpenTelemetry Collector,可以实现自定义采样,统一管理业务接入token,降低业务接入复杂度
效果对比验证
支持同时接入腾讯云APM和友商APM,同时进行功能验证
icon标杆案例-TT语音企业级调用链平台icon

内嵌APM控制台方案,打通客户和腾讯云之间的账号体系(1/2)

icon标杆案例-TT语音企业级调用链平台icon

内嵌APM控制台方案,打通客户和腾讯云之间的账号体系(2/2)。客户内部平台直接嵌入APM控制台,无需登陆腾讯云控制台即可使用APM。对接内部权限系统,同时APM支持标签级权限控制,为业务使用APM平台扫清障碍。

icon标杆案例-TT语音企业级调用链平台icon

挑战:多云场景下已存在物理专线,数据上报到APM平台。方案:通过Private Link实现vpc之间的互通。收益:输出一套多云场景,跨地域场景下数据上报方案。

iconFAQicon
1.应用性能观测客户常见的场景和痛点有哪些?场景A:业务场景大且架构复杂,使用开源协议自建了链路。痛点A:自建的链路监控系统性能差,研发难度高,经常遇到BUG难以维护,导致查询变慢,告警不及时等。场景B:已使用友商产品,微服务架构,应用多。痛点B:指标-链路-日志一体化程度不高,未能与云上其他组件打通,没有端到端打通。场景A:研发系统混合了自研与分包开发,需要验收分包开发部分的质量及后续运维。痛点B:理解分包系统架构成本较高,导致无法快速准确定位到问题。2. 应用性能观测支持的付费模式是?当前仅支持后付费模式,费用由上报量和存储时长两部分组成,根据用户的使用量、地域、所选择的数据存储时长等来进行收费。
3. 应用性能观测支持什么语言?目前应用性能观测已经支持 Java、PHP、Go、Python 和 C++,其他主流语言会在今年内陆续支持。4. 应用性能观测可以监控其他云厂商的集群吗?应用性能观测支持混合部署的场景,您只需要确保 Agent 可触达外网,则可以通过应用性能观测服务提供的外网上报地址来上报服务信息,监控您部署在其他云服务商集群上的应用。5. 探针是否会侵入业务代码?应用性能观测探针不侵入业务代码,对于不同语言,您需要安装 Agent 或者引入对应插件,即可开始监控您的服务。
产品推荐 查看更多>>
    腾讯云物联网通信平台 IoT Hub

    腾讯云物联网通信(Internet of Things Hub, IoT Hub)旨在提供一个安全、稳定、高效的连接平台,帮助开发者低成本、快速地实现“设备-设备”、“设备-用户应用”、“设备-云服务”之间可靠、高并发的数据通信。物联网通信平台不仅可以实现设备之间的互动、设备的数据上报和配置下发,还可以基于规则引擎和腾讯云产品打通,方便快捷地实现海量设备数据的存储、计算以及智能分析。

    快速实现设备的接入和数据通信

    有效防范数据窃取、篡改等风险

    提供全天候的运维监控服务

    实现海量设备数据的存储、实时计算以及智能处理分析

    腾讯云流计算Oceanus

    流计算 Oceanus 是基于 Apache Flink 构建的云端全托管流式数据汇聚和计算服务,云原生容器化部署,提供一站式SQL及JAR作业开发与运维平台,可以便捷对接丰富的云上数据源,以低门槛、低成本、高可用、灵活伸缩、生态友好的产品形态,帮助企业轻松应对海量数据实时处理和分析决策的挑战。

    云端全托管流式数据汇聚和计算服务

    提供一站式SQL及JAR作业开发与运维平台

    便捷对接丰富的云上数据源

    轻松应对海量数据实时处理和分析决策的挑战

    腾讯云 数据治理

    腾讯云-数据治理,基于腾讯海量数据处理经验,面向数据全生命周期,提供数据盘点及治理体系顶层规划设计、数据标准化专项咨询、模块化的大数据基础设施、工具、应用及服务,助力获取大数据时代核心竞争优势,构建企业级数据仓库。

    提供一站式数据规划、集成、开发等服务

    成熟的数据管理套件产品及项目实践

    助力获取大数据时代核心竞争优势

    构建企业级数据仓库