icon需求背景-实践管理过程中会遇到的挑战icon

随着政府数字化转型的发展,在业务系统、迭代演化进程中,系统架构和业务调用关系复杂,运营及运维管理难度日益凸显。现有业务系统多采取烟囱式建设方法,用户体验、应用性能和基础支撑组件分析数据互通困难,无法做到及时响应、及时发现并解决问题。现亟需结合业务场景收集及应用性能指标关联分析的解决方案,为应用性能管理提供可量化、可视化、集约化的决策支撑。

用户体验难了解
缺乏从用户视角了解系统体验的有效途径,无法对应用服务进行有效体验评估;
问题故障难定位
面对各种数字体验问题,无有效的现代化的分析手段,需专人写复杂的语句去查询;
数字转型成果难量化
各个业务系统之间,运维监控存在孤岛,无法横跨多个业务、多个场景,量化科技创新成果。
icon突破单一视角的一体化数据采集icon
icon六层全面自采指标体系为故障感知提供质量标准icon
业务

通用指标:业务可用性、业务错误数、完成业务数、报错业务数、活跃用户数、错误影响用户数、业务流可用性、完成业务流、报错业务流、在途业务流、活跃用户数、错误影响用户数、平均执行周期、操作可用性、操作成功次数、操作失败次数、同比环比。自定义指标:交易金额、交易笔数、top10商家销售排名、top10热销商品、top10营业点等。

用户体验

移动端:首次启动时间、首次启动次数、冷启动时间、冷启动次数、热启动时间、热启动次数、页面流畅度、页面完整度、页面打开次数、页面交互时间、页面展现时间、操作可用性、操作次数、操作耗时、流畅操作占比、慢操作占比、卡顿占比、崩溃操作占比、失败操作占比等。PC端:PV、完全加载、白屏时间、首屏时间、可交互时间、JS错误率、慢页面占比、慢页面次数等。小程序端:用户数、PV、onReady、首次响应、请求耗时、请求错误率、JS错误率、页面退出率、请求总耗时、请求次数、慢请求占比、服务端耗时等。

应用服务

公用指标:健康度、异常次数平均响应时间、执行时长、执行时间、吞吐率或平均吞吐率、峰值吞吐率、应用数量、实例数量、容器数量、主机数量、数据中心数量、实例数量、错误率、耗时百分比、异常次数。服务组件-MQ组件:类型、实例、消息生产吞吐率、消息消费吞吐率。错误分析-错误列表:开始出现时间、最后发生时间、持续时间、错误类型、异常名称、发生次数。事务追踪:最小响应时间、最大响应时间、参数内容、慢追踪、时间、追踪ID、事务名称、响应时间、用户标识、业务标识、应用、实例、异常。

系统

操作系统:AIX、Linux、Windows、 软中断时间、system time、idle time、iowait time、可用内存大小、交换分区大小、系统启动时间、登录用户数。数据库:Oracle、DB2、SQLServer、MySQL,QPS、慢查询次数、平均连接数、组件所在主机、集群、组件ID、每秒处理事务数等。中间件:WebSphere、MQ、TOMCAT、Redis、WebLogic。

服务器

主机:CPU使用率、内存使用率、磁盘使用率、网络IO、磁盘读IO使用率、磁盘写IO使用率、磁盘读吞吐量、磁盘写吞吐量、磁盘读IOPS、总计磁盘写IOPS、网络发送速率、网络接收速率、每秒网络发送包、每秒网络接收包、每秒网络发送错误包、每秒网络接收错误包。虚拟化、容器:运行状态的容器数、CPU使用率、内存使用量、组件所在的主机、集群、组件ID等。

基础设施

网络设备:路由器、二三层网络交换机、多层交换机、负载均衡设备。安全设备:防火墙、入侵检测、防病毒、加密机。

icon海量数据赋能听云一体化分析平台场景icon
接入 兼容多个数据源、多种协议的外部指标标准化接入。
分析 用户可以通过指定的维度去分析指标的变化,也可以设置过滤条件查看指标。
浏览 可视化指标预览,支持多种图标类型自定义度量、过滤条件、维度展示指标数据。
监控 配置指标监控对象、检测类型、前置条件、触发条件等实现对指标的监控和异常检测。
告警 通过人工配置和AI智能的方式将不同的告警事件关联在一起,达到事件收敛和智能降噪的效果。
icon一套平台 全栈分析icon
icon形成业务体验持续提升的迭代机制icon
icon全面的用户体验评估icon

以数字化体验为中心,用户需求为出发点,结合业务流程,构建满意度测量指标体系;以便快速找到用户体验的痛点,锁定破坏客户体验的关键性问题。

icon业务监控全栈化,全方位感知业务服务状态icon

对于数字化体验问题,不仅能及时识别问题发生,还可以通过听云端到端全栈性能可视化解决方案,将传统的黑盒运维转变为白盒运维。对于影响用户体验的问题,快速隔离问题故障域,查找问题故障点,找到影响用户体验的网络、代码、数据库的根本原因。通过不断优化系统,提升运维控制力,保障以用户体验为宗旨的数字化系统的持续稳定运行。

icon云原生组件监控icon

听云支持对主流平台组件的监控,包括主机、Web Server、数据库、非关系型数据库、MQ等;

icon基于业务视角的追踪分析icon
icon指标关联分析icon

听云支持以关联视角,将业务层、应用层、资源层做聚合,可进行关联分析,发现资源导致的组件问题、组件问题导致的应用问题,层层关联和钻取,快速发现问题根因;

iconVIP用户主动预警icon

对高净值或高重要性的VIP客户,听云支持对此类VIP客户进行强力监控,可基于用户粒度,设定独立的警报策略,对出现错误或故障的次数进行实时告警,第一时间发现问题,将被动式服务变为主动式关怀。

iconAPP端问题定位icon
icon页面问题定位--首屏时间长icon
icon端到端全栈追踪icon

对任意发生过的用户使用问题进行追踪,并可关联后端调用链,从而实现对用户使用过程的端到端可视化追踪

icon代码级性能诊断及故障定位icon

结合业务流程快速找到客户体验的痛点,锁定破坏客户体验的关键性问题。自动学习、识别、记录业务交易的类型,业务代码类执行的效率及业务性能匹配模式,帮助用户实现从代码类、参数到数据库语句整条交易链的性能诊断和故障定位。

icon智能根因定位icon

功能及优势:听云解决方案利用先进的大数据和AI技术,进行智能关联分析、智能基线和告警、智能根因分析,自动化适应微服务、容器化、云的环境,解决传统人力运维的不足和成本问题,将运维监控管理推向智能化的方向。

icon业务日志联动icon

APM 探针自动在用户的日志内容中打入追踪ID。追踪ID,在一个完整调用链中保持不变。

icon从业务视角追踪改善效果icon
icon多维场景快速接入 量化服务成果icon

支持按业务优化决策需求,快速构建全景数据展示大屏,如系统的网络拓扑、业务体验、应用调用链,将业务、性能、指标等数据统一结合,支撑快速决策。

icon江苏人社:提升惠民服务质量,实现主动式服务管理icon
应用场景
我明明缴费成功了,为什么还显示未有记录,我ID号是150XXX3303
解决方案
用户追踪分析该用户的访问、报错和执行时间数据,掌握用户的投诉心理 定位报错操作,追踪过滤用户的所有报错操作,分析其性能数据 业务流追踪定位用户的业务流转节点
icon江苏人社:持续利用大数据,AI等技术增强运维智能化icon

功能及优势:随着新一代大数据,AI技术的应用,江苏人社一体化平台需要向智能运维方向演进。听云解决方案利用先进的大数据和AI技术,进行智能关联分析、智能基线和告警、智能根因分析,自动化适应微服务、容器化、云的环境,解决传统人力运维的不足和成本问题,将运维监控管理推向智能化的方向。

icon江苏人社:推进多家开发商之间的互补联动效益icon

江苏省人社一体化平台由多厂商联合开发,听云平台以第三方身份,为运维和开发单位提供故障和优化点的定位分析建议,推动各开发厂商之间的责任定位及协同工作关系,厂商可以更专注高效地解决性能问题,有效缩短问题处理的会议沟通时间。

icon江苏人社:专业服务报告icon

由听云专家团队针对发现的问题出具分析报告,并提供解决方法或优化建议。

icon项目背景-动动手指就办事,智慧生活一点通icon

灵锡是以政务+公共服务为主,以提升民众体验感与获得感为目标,整合城市服务资源,打造数据智能闭环,以运营服务体现数据价值,构建“以人民为中心”的新型、城市服务平台,涵盖城市智能、数字孪生、全域预约、政务办事、城市资讯、交通出行、便民缴费、城市生活、学在无锡九大特色场景。一体化信息管理平台将助力灵锡实现“以人民为中心”,不断提高群众满意度和获得感。

基础设施互通
对操作系统、云原生等组件监控,实现数据共享,便捷化管理;
警报及时性
对于基础设施、应用服务出现异常现象,及时告警并通知;
故障分析定位
APM、基础设施监控一体化监控,基于一套数据进行故障定位。
icon解决方案思路icon

解决方案目标:解决系统环境复杂性上升带来的把控力下降的问题,提升运维效率,简化日益繁琐的运维难题。运用大数据及机器学习,快速梳理一团乱麻的运维问题,定位根因。打破大部分运维监控管理体系中存在的“监控孤岛”现象,实现全面完整的系统监控。

icon服务成效:基础设施统一管理,数据实时共享分析icon

化被动为主动,通过简单便捷的监控方式,快速实现承载业务系统运行的基础环境、组件的实施监控,监控平台可以实时展示所有被监控操作系统,基础组件的环境信息、运行状态等指标数据,做到监控数据共享及分析,大大减少人力,提高运维效率。帮助灵锡快速监控、维护基础设施环境,为业务系统的健康稳定运行打下坚固的基础。

icon服务成效:网络状态实时监控icon
icon服务成效:智能告警及多方式推送icon

功能及优势:听云智能告警提供灵活的告警规则配置和固定阈值、动态基线、异常检测多种监测手段。智能告警在传统告警模式上增加了智能告警算法,在配置好团队内性能关键管理指标后,可进行自动诊断,根据告警历史数据进行智能检测,从而提高告警准确性,达到缩短故障时间、减少误报漏报,并根据定义的告警推送功能,快速将告警信息发送至钉钉群、个人手机短信、电话通知等,做到快速响应的目的。

icon教育部考试中心:项目背景icon
痛点说明
阶段性业务高峰,每次业务高峰不定量,无法准备评估系统承载能力。报名期间,出现故障无法快速定位及解决,影响舆论,领导压力较大。各业务系统都是外包开发,出现问题时推动厂商修改比较难。
解决方案
服务+产品模式,服务包含(专家驻场服务、压测服务、故障分析及优化服务)。
icon教育部考试中心:听云的保障服务icon
上线前压测评估

场景:报名系统上线前,外包开发系统全面验收。服务内容:客户使用JMeter脚本对业务系统进行压测,听云依据悟空平台采集到的RUM数据、APM数据出具压测报告,提出优化改进建议。

系统性能评估及问题定位

场景:系统经常出现卡、慢、操作失败现象,采购的三方系统出现性能问题无法定位。服务内容:通过听云平台对系统进行为期 1周左右的监控获取相应数据,由听云专家团队针对发现的问题出具分析报告,并提供解决方法或优化建议。

业务高峰期现场保障

场景:业务高峰期用户访问量大,系统容易出问题。服务内容:在业务高峰期通过听云平台对系统进行相应数据采集,由听云服务工程师现场对数据进行分析并协助客户运维研发团队进行问题定位及提供优化建议。并在高峰期后3个工作日内提供本次数据分析的标准报告。

icon教育部考试中心:服务成功icon
icon公司资质icon
icon信创认证icon
产品推荐 查看更多>>
    博睿宏远桌面端应用性能监测

    Bonree WinSDK是国内独家以精准定位Windows应用程序性能问题为目标的性能监控产品,帮助企业迅速定位、解决Windows应用程序性能问题,提升用户体验,助力企业业务优化。

    丰富场景

    功能完备

    安科瑞医疗建筑综合能效管理系统

    AcrelEMS-MED医院综合能效管理系统由变电站综合自动化系统、电力监控及能效管理系统组成,压变配电系统、应急电源、IT配电系统、照明控制、设备运维等,贯穿医院能源流的始终,帮助运维管理人员通过一套平台、一个APP实时了解医院配电系统运行状况,并且根据权限可以适用于医院后勤部门管理需要。

    应急电源

    照明控制

    设备运维

    IT配电系统

    阿里云应用实时监控服务ARMS

    阿里云应用实时监控服务ARMS作为云原生可观测平台,覆盖 Java、Go 等众多开发语言,从拨测主动发起监控,到前端监控(Web 应用、APP 应用)、应用监控(APM),提供全栈、多场景的监控与分析能力。并基于 Trace、Logging、Metric 等观测数据的关联,将前端请求与后端调用打通,实现全链路追踪与根因分析。

    Web应用

    应用监控

    全链路追踪

    根因分析