智采CloudProbe的“破”与“立”:构建云原生2.0的全栈统一可观测性

来源: 云巴巴 2022-04-28 14:40:21

云原生时代,业务系统架构持续变革。伴随着云原生逐渐从以“资源为中心的1.0时代”,迈入“以应用为中心的2.0时代”,微服务架构已经成为企业新一代业务系统发展的主要方向。

 

 

云原生2.0时代,需要云网全栈式的统一可观测

 

在微服务架构下,业务系统模块各自独立,相互之间通过Service Mesh通信。拆分后的微服务架构可以独立运行,并通过微服务编排技术、微服务框架等组合成完整功能的业务系统,让使用者可以根据需要灵活地纵向扩展和缩减IT资源。同时,还可以快速预配新的应用程序,提高底层基础架构的可靠性。至此,运维工作也逐渐分化为传统运维与平台运维。在面向云原生的运维场景中,需要以应用为中心,支持纵向的流量采集与管理能力,构建云网全栈式的统一可观测。

 

(云原生2.0运维需要支持纵向的流量采集与管理能力)

 

在实际运维场景中,要实现从底层基础架构到上层应用的统一管理,就要具备纵向流量的采集与管理能力。但在此过程中往往会面临以下挑战:

  1. 由于云上IP地址已经不能作为标识应用的特征,使得原有按照网络五元组采集网络数据的策略再无用武之地,云上网络黑盒对流量采集带来极大挑战

  2. 采集后的流量如果不进行预处理与加工分析,就会导致流量传输丢包率过高、云网开销过大等一系列问题

  3. 随着云流量暴涨,云上采集节点数量也呈指数级增长,企业需要部署大量的采集器,而如何管好采集器是云网采集分析能力落地的重要前提

  4. 为满足云上业务应用分析的需求,流量采集工具需要精准对接云平台、获取云资源清单。因此,需要具备自管理与对接云平台管理的能力

智采CloudProbe

三大关键能力,破局云原生2.0流量采集难题

 

云原生2.0时代,应用已实现高度自动化,构建全栈统一可观测,就需要建立资源与应用的统一可观测视角。而可靠的云流量采集是实现云原生可观测性的重要基础,却也恰巧是最具挑战的环节。首先,流量采集需要攻破云上黑盒,实现从底层宿主机、云主机到容器,乃至上层应用的纵向支持;其次,流量传输与处理会对云网IO与业务应用等产生极大影响,需要相应的流量处理工具与机制;第三,对于采用多云架构或者混合云架构的企业而言,一方面,流量采集器的部署规模可达到上万台,需要对流量采集器进行管理;另一方面,还需要对接各大云平台精准获取云资源,为云应用可观测做好准备。

 

破局云原生2.0时代的流量采集难题,天旦新一代智能云网流量采集与管理产品“智采 CloudProbe”应运而生。“智采”主要聚焦云网流量全栈、全量、全链路的采集与汇聚,基于云原生的资源与应用视角,通过精准的流量控制,广泛覆盖源端流量、末端流量,实现云分流、云适配与云可控,满足精细化的业务运营管理需求,为实现云原生可观测性提供基础。

 

“智采”由三大关键组件构成

  • 流量采集器Netis CloudProbe Agent:对云网流量进行全栈、全量、全链路的采集,攻克云上网络黑盒;

  • 流量中继器Netis CloudProbe VTAP:对采集获取的流量进行多层处理与加工,减少云资源消耗、提高传输效率;

  • 流量管理控制平台Netis CloudProbe Manager:对流量采集器进行管理,并充分对接云平台,实现云资源与应用的可视化、可观测。

(“智采”三大关键组件)

 

智采可广泛支持各类场景的数据包消费需求,包括:业务性能监控、网络性能监控、数据库性能监控、安全审计等。基于各种应用场景下的部署需求,可灵活组合CloudProbe Agent、CloudProbe VTAP、CloudProbe Manager等应用产品。

 

与此同时,“智采”通过以上三大关键组件,赋予云流量采集与管理三大关键能力

  • 云分流:“智采”通过API获取云资源清单,并按照云内资源定义(VPC、Vswitch、Namespace、Service等),实现智能流量过滤。“智采”支持对流量按需裁切、去重,并通过GRE、VXLAN隧道和可靠性传输队列进行流量分发;

  • 云适配:“智采”适配云原生业务环境,通过主动机制,实现注册、策略拉取的轻量化交付,规避云网限制,保障云网安全持续运行。同时,采集过程中通过数据包染色机制,实现云内资源的重定向,简化后端消费平台的读取复杂度,为后端上云提供坚实的基础;

  • 云可控:“智采”采用零业务侵入、零代码写入的部署方式,并通过自限熔断算法,保障性能监控产品在云内的稳定运行。为避免对云上业务的侵扰,“智采”的终端采集器采用非业务侵入式部署方式,规避对的业务持续性影响。

 

(“智采”三大关键能力)

 

 

 

 

 

天旦核心技术驱动,让全栈统一可观测可靠落地

 

云原生环境,资源时刻保持动态变化。流量采集器必须在获取资源实时动态变化的同时,从容应对云上采集对象的指数级增长。此外,云流量在传输的过程中时长会发生丢包等现象,流量采集与管理工具必须采取相应策略保障传输的可靠性。

 

而天旦对于云环境可观测性的技术研究已有多年。早在2018年初,天旦就已经在GitHub上启动了Netis PacketAgent开源项目,为云原生环境下的流量采集提供可靠的技术保障。在Github上,Netis PacketAgent已收获891颗Star、156个Fork,并持续发布了20个Release版本。目前,Netis PacketAgent已适配CentOS、SUSE、Ubuntu、Windows等操作系统,支持多种云底座以及云原生场景下的流量采集。

 

(来源:Github,Netis Packet-Agent开源项目进展)

 

在“智采”产品中,天旦通过“两大核心机制”&“一套技术标准创造”,赋能“智采”卓越的云流量采集能力,灵活应对云资源动态变化、降低传输丢包率、降低云网资源开销等,保证“智采”可靠落地全栈统一可观测的能力。

 

  • 核心机制:动态扩缩适配机制

    “智采”通过订阅机制,可快速获取资源的动态变化,并及时更新监控信息,提升监控的完整度。同时,为了更好地适配业务场景,“智采”采用云上Service资源视角替代服务端IP。全新的云原生可观测性流量采集,从容应对云上采集对象的指数级增长。 

  • 核心技术:可靠性传输机制

    不可靠的网络传输会导致数据丢包,进而影响运维监控的准确性。“智采”采用可靠性传输机制并结合队列机制,将原来1%的误差降低到0.1%以下,准确率提升了10倍以上。 

  • 全新技术标准:Netis Telemetry技术

    作为天旦推出的全球首个全栈可观测性技术标准,Netis Telemetry关注业务应用与服务的整体可观测性,为实现云原生可观测提供技术底座与数据支撑。Netis Telemetry采用列式封装技术,经过天旦独创的Teleport传输协议来实现大吞吐量、高并发量的采集数据的传输与存储。基于Netis Telemetry技术,“智采”不断优化数据格式,在信息密度提升10倍的同时,云网开销实现10倍下降

 

由于云原生底层环境复杂多变,为了最大化发挥流量采集的性能与效率,“智采”针对不同环境采用不同的采集技术与策略。譬如,针对linux环境,“智采”通过解决eBPF受限于特定kernel的限制性问题,采集性能最高可达单虚拟机/pod 10Gbps以上。

 

此外,“智采”还可与传统云下TAP设备融合,实现跨越云上云下的一体化全链路流量采集与管理,实现云上云下的业务串联,为全链路监控与分析提供保障,建立资源与应用统一的云原生可观测视角,真正构建全栈统一的可观测能力,护航云原生2.0时代的云上业务性能,冲上云霄。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

云巴巴案例秀 ‖ 车联网的规模化敏捷开发,TAPD提升持续交付能力

云巴巴案例秀 ‖ 车联网的规模化敏捷开发,TAPD提升持续交付能力

现如今腾讯智慧出行车联网已与超过35家主流车企达成合作,落地车型多达150余款,累计搭载车辆超过700万台。其实在项目初期,团队在交付环节面临着不少痛点,但通过TAPD敏捷开发平台实现了从标杆项目单车交付到生态化项目交付体系的建设。

2024-03-27 14:35:22

疫情期间,大数据分析都悄悄干了什么?

疫情期间,大数据分析都悄悄干了什么?

不管你承认与否,大数据一直与我们的生活息息相关,疫情期间,大数据分析技术在各行各业开始发光发热,可以说是展现了满满的风采,无论是抗击疫情,还是统计报表,都有大数据的影子。

2020-03-13 17:47:33

打工人报销难?费控管理SaaS汇联易直击行业痛点

打工人报销难?费控管理SaaS汇联易直击行业痛点

汇联易针对行业痛点,通过数字化、智能化方式驱动SaaS产品快速迭代,提供全流程费用管理服务,高效合规降本,提升财务管理价值,提供全面费用管理服务。

2023-11-09 17:57:03

视频会议行业的市场发展回顾与前景

视频会议行业的市场发展回顾与前景

目前我国的视频会议市场需求主要受两个因素驱动,一方面是行业应用逐步深入,另一方面是技术迭代所带来的持续升级更新。

2022-11-23 10:50:11

电商发展的新引擎:小望电商通功能模块全面解析

电商发展的新引擎:小望电商通功能模块全面解析

随着电子商务的飞速发展,企业对于电商管理软件的需求日益增长。小望电商通,一款功能强大的电商开票管理软件,应运而生。

2023-06-27 16:57:50

腾讯云的OCR识别产品支持哪些证件识别(二)

腾讯云的OCR识别产品支持哪些证件识别(二)

现在我们每个人都能接触到的OCR证件识别便是身份证OCR识别了,在上篇文章中也给朋友们详细介绍过都能够识别出哪些内容和产检的应用场景有哪些。

2022-11-24 09:58:27

严选云产品

滴滴企业版企业出行商旅与费控平台 滴滴企业版企业出行商旅与费控平台,随时随地无纸化提交和审批,智能报销系统,让报销更简单,让员工更轻松。费用明细一键导出,让财务团队更好地跟踪费用和分析财务数据,全面精确的后台行程数据实现信息化、数据化管理。
综合金融服务平台 综合金融服务平台是蚂蚁智能科技监管科技事业群推出的一款面向政府及其指定运营商的产品解决方案。智能金融服务平台利用人工智能、大数据、云计算和区块链等领先科技手段,融合各地金融实践而建立的监管+服务科技系统。目前平台已为金融机构监管和扶持企业融资服务方面提供技
百家云Boom视频会议系统 百家云Boom视频会议系统,引入投影机、音箱话筒等多媒体设备,系统独立,模式效率低,设备操作复杂。 以科技化、智能化、便捷化为原则,整合诸多先进技术及系统资源,为用户提供贯穿会前-会中-会后的全流程服务。
智塑云注塑大师 智塑云注塑大师,B/S架构,只需部署、维护服务端,无需安装/升级客户端,安装部署和使用都方便易行,减少长期使用的维护成本。可以ERP/MES/WMS/OA/PDM/PLM/CRM/EAM/AGV/集中供料等系统进行集成,形成信息流和管理上的闭环。
随锐科技 多媒体通信软件 会见私有视频通信云解决方案,致力于让政企客户随时随地安全、高效、便捷地进行商务沟通协作。
永友云智慧社区解决方案 永友云智慧社区解决方案以云计算+物联网+互联网+人工智能,通过解决业主与物业公司矛盾尖锐,业主满意度低;物业公司服务人力成本上升,盈利困难;物业服务缺乏标准,难以规范管理;物业基础管理薄弱,从业人员素质偏低等问题,实现物业数字化、线上化、智慧化高效率、低成本、品牌化行业。

甄选10000+数字化产品 为您免费使用

申请试用