立即咨询

电话咨询

微信咨询

立即试用
商务合作

快猫星云Flashcat一体化智能可观测平台

快猫星云 Flashcat 一体化智能可观测平台专注提供云原生监控系统与应用性能监测平台的数字化解决方案。依托 AI 驱动的自动化分析技术,实现对云原生架构、微服务及分布式系统的全链路观测,支持实时性能监控、日志分析、异常预警及根因定位
立即咨询

 

iconFlashcat 解决什么问题icon

可观测领域面临的挑战:

太多的监控工具
太多的Dashboard
已有的工具无法很好的适应Kubernetes监控需求
各家云提供的监控工具无法融合
一个个的监控数据孤岛,数据割裂难以打通

太高的数据存储成本
处于被动状态的技术团队,往往晚于用户反馈发现问题
不可控的故障定位和处理过程,故障处理进度不透明
太多的告警,工程师On-call压力大、体验差术
iconFlashcat 解决什么问题icon

Flashcat旨在构建一个一体化的观测平台,并致力于解决服务稳定性保障过程中的核心难题。

一体化观测平台
多对象:物理机/微服务/网络/Kubernetes组织好数据
多平台:公有云、私有云、多云
多维度:Metrics、Logs、Traces
稳定性保障助手
发现故障:快速准确发现业务故障用好数据
定位故障:一站式、引导式完成分析和定位
最佳实践:持续积累和进化的稳定性保障实践

 

icon整体架构和特点icon

 

统一采集
采用插件化,内置集成上百种采集插件,GPU、服务器、网络设备、中间件、数据库、应用、业务,云上云下,均可监控,开箱即用
统一集成
可集成企业内部已有的、云上云下的可观测配套系统,支持对接数十种数据源,已有工具无需推倒重来,充分利旧,减少落地阻力,快速见效,串联打通数据,发挥协同分析的价值。
统一观测平台
将Metrics、Logs、Traces、Events、Profiling等多种可观测
性数据拉通,一个平台集中观测,具备完整的平台能力。
统一告警OnCall入口
支持指标告警、日志告警、智能告警,支持收集数十种各类监
控系统的告警事件,进行统一的告警收敛、降噪、排班、认
领、升级、协同,大幅提升告警处理效率,是各技术团队日常
协同处理告警的统一入口。
统一故障发现定位入口
预置稳定性保障行业最佳实践,既提供全局业务视角,又具备
层层下钻的、引导式的故障定位能力,有效缩短故障发现和定
位时间,是各技术团队稳定性保障的统一入口。
 
 
 
 
 
 

 

 

iconFlashcat|统一的故障发现定位入口icon

故障发现定位模型

 

 

故障发现定位模型

 

 

 

 

iconFlashcat北极星一发现真故障,确定影响面和程度icon

 

 
  • 北极星指标必须是公司上下人人都容易直观理解的,含义和重要性不言自明的。
  • 北极星指标的配置和生成应该是非常简便易得的。
  • 北极星指标必须是实时的,这样才能第一时间发现业务受损的情况。
  • 针对北极星指标的异常波动检测是要非常准确的,否则就是狼来了。
  • 针对北极星告警,需制定明确的应急响应流程。

 

 

iconFlashcat事件墙-快速确定或者排除相关事件icon

70%的故障都是由变更引起的!快速找到这些有关联的事件,是故障止损最应优先尝试的手段。

 

 

 

iconFlashcat灭火图--圈定故障范围和对象icon

 

 
灭火图的特点:
从观察一个个指标,转为观察一个个对象,对象可以
是API、主机、设备、模块、数据库实例等
明确、直接的给出被观察对象的“健康与否”的结论
按照逻辑结构,对观测对象进行分层
以观测对象为中心下钻关联到Metrics、Logs、Traces台

 

 

icon以灭火图为中心下钻,串联分析多维可观测性数据icon

 
  • 不断的将更多的经验、知识、能力,沉淀固化到下钻链路上,让每位工程师都能拥有轻松调查故障的能力。
  • 在一个平台上完成指标、日志、链路追踪数据的统一存储、可视化与分析。

 

icon面向不同人群建立针对性的视图icon

 

 

 

iconFlashduty|统一告警On-call的入口icon

On-call 面对的挑战

告警数量多
技术团队每天接收到大量的告警
协同差
告警处理缺乏协同,处理过程不透明,信息难以共享,知识难以沉淀。
告警响应慢
很多告警长时间无人响应,长期无人问津。
IT 满意度低
客户往往先于技术团队发现故障对IT的满意度持续走低。

 

 

icon一站式On-call平台,加速企业告警响应icon

 

 

icon对接各种告警事件icon

 

 

 

icon告警降噪,显著降低告警数量icon

 

 
对相似告警进行聚合
事件 => L1 告警 => L2 故障
减少通知,避免告警风暴
规则聚合、智能聚合,至多降噪 90+%
对频发告警进行收敛
避免狼来了效应
避免频繁被打断

 

 

icon数据增强,丰富告警上下文icon

 

历史变更事件
70% 的故障由变更导致
CMDB 元数据
资产关系依赖映射
知识库和 SOP
在故障信息中展示 SOP
历史故障记录
参考相似故障的解决办法。

 

 

icon排班值班,避免整个团队被频繁打断icon

 

 
满足各类场景
日常、节假日、调班、限时、公平轮换
建立主备值班机制
支持多人同时,按角色值班
分派告警到值班人
不要随机分派,更不要分派到整个团队

 

 

icon告警升级,正确的时间通知需要的人icon

 

 
制定升级路线
为故障制定清晰的升级路线
A: 确保问题得到响应
不因漏处理告警而引发更大损失
B: 从容应对紧急情况
发生紧急情况不慌张,有协作

 

 

icon通知,及时精准高效的触达干系人icon

 

 

 

iconIM/App集成,随时随地处理故障icon

 

 
实时通知
将故障的任何变化及时投递到 IM、App
多端操作
在 IM、App 内查看、处理故障,操作多端同步
加强协作
一键拉起作战室,关键信息回传到平台

 

 

icon自定义操作,集成工作流icon

 

 
API集成
以按钮 形式集成到控制台、IM 消息卡片
自动化流程
集成任何自动化、SOP 流程
典型场景
重启主机 、回滚变更、AI根因分析
一键拉群 、发布 Status Page

 

 

icon数据驱动,推动告警处理流程持续优化icon

数据统计,通过数据驱动不断推动告警治理和优化。

 

 

iconCategraf| All-in-one的采集器icon

开源/All-in-one/开箱即用

 
 
1、中心端集中管理所有采集点配置
2、支持agent自升级
3、支持标签增强
4、支持agent模式、Proxy模式运行
5、支持K8s部署
6、支持网络拨测
7、支持Pingmesh排

 

 

icon采集器增强- Pingmeshicon

 

 

 

 

icon采集器增强-网络拨测icon

 

多协议
HTTP、TCP、UDP、ICMP、WSDL
针对Reponse 做匹配
多拨测点
可选择安装了Categraf的一个或多个设备

 

 

icon多数据源集成icon

对接40多种数据源与企业已有的可观测性配套,深度集成融合,对其进行统一分析

 

 

 

 

icon日志统一可视化icon

 

 

 

 

icon日志转换和报表icon

 

 

 

icon统一的仪表盘icon

 

 

 

 

icon针对各种数据源集中配置和管理告警策略icon

 

 

 

 

 

icon监控告警大屏icon

 

 

 

 

icon边缘部署模式icon

 

 
 
高效应对全球化架构
用户只需要面对Flashcat-centre
中心和边缘网络中断时,edge可独立闭环工作
不适合传输到centre的数据,可在edge 侧保存和处理

 

 

产品推荐

天图城市社群关系分析系统
云天励飞自研全球领先的人像聚档与图谱分析技术,构建城市人口档案,挖掘人员关系,助力城市精细化治理
免费试用
查看详情
科脉蛙笑烘焙行业数字化经营管理解决方案
科脉实现OAO数据融合,线上线下流量互通是拓宽盈利通路的最佳途径,自动接单,提高效率。大幅降低人工成本,OAO数据融合—互动应用。实现集成管理、信息共享和协同工作。
免费试用
查看详情
有赞微商城小程序
有赞微商城小程序,行业公认的微商城产品的权威性标杆。多平台多场景直播卖货,提转化、变现快,打通微信、支付宝、微博、快手等10+推广渠道,获得海量曝光,开展精准营销,降低试错成本,提升成交转化。
免费试用
查看详情
新锐科技太阳能企业生产制造系统
Softone电池片生产制造 是基于Softone开发平台给光伏企业电池片生产制造过程打造的一款的生产制造执行系统,从计划、工艺、生产、质量及设备一条线精细化管理。
免费试用
查看详情