博睿宏远大数据处理引擎_大数据引擎-云巴巴 -云巴巴

立即咨询

立即试用

商务合作

博睿宏远大数据处理引擎

博睿数据以10年的大数据项目实践经验，抽象和设计出一套灵活轻便、场景通用、稳定高效的超级大数据处理引擎框架—Bonree Ants，以满足企业复杂多样的数据处理需求。

立即咨询

背景

越来越多的企业认识到大数据对于自身未来发展的重要性，纷纷开始使用并逐渐依赖大数据处理的相关技术。但随着需要处理的数据越来越多，业务场景越发复杂，在实际执行过程中遇到很多问题，如大数据人才紧缺，相关技术缺乏沉淀，难以突破瓶颈，同时不同业务部门的业务需求纷繁多样，导致不同项目代码重复开发、重复造轮子、项目技术架构五花八门的情况也很常见，给后期维护和迭代带来很大的挑战。

对于以上的现实问题，博睿数据以10年的大数据项目实践经验，抽象和设计出一套灵活轻便、场景通用、稳定高效的超级大数据处理引擎框架—Bonree Ants，以满足企业复杂多样的数据处理需求。

概述

Ants（蚁群）名称源于其寓意：高效协作、小而有力、合纵连横，我们认为其可以诠释这套超级引擎框架的初衷：轻便灵活、场景通用、稳定高效。

Bonree Ants大数据处理引擎框架是一个针对时序指标数据处理的通用流式计算引擎框架。此引擎框架负责范围包括原始数据预处理、准实时计算（支持默认算子和自定义算子）、多种时间粒度批量计算、数据落地及各种容错处理，同时支持自定义高级功能自定义扩展机制，默认支持如时序指标动态基线计算、报警条件判断计算等扩展等。

价值

Bonree Ants可以帮助企业便捷快速的实现海量时序指标数据的在线流式处理。我们的目标是，对于常见的时序指标流式处理的业务场景可完全不需要研发人员参与，只需非研发业务人员对数据应用进行简单配置和业务脚本描述，即可实现其目标；而对于复杂业务场景我们则希望研发人员通过引擎的插件机制，进行少量编码来实现相关与业务强关联的逻辑，而将大数据处理中底层复杂的资源调度、任务编排、容错处理交给引擎负责，快速实现相关大数据处理业务开发，极大降低企业相关开发和维护成本通过在博睿数据众多服务项目的实践，应用Bonree Ants引擎框架之后，大数据处理开发工作量整体降低了80%，整体项目周期缩短40%以上。

整体架构

Bonree Ants整体架构图

    Bonree Ants引擎框架依赖开源组件运行：ZooKeeper、Kafka、Storm、Redis，依赖少，部署简单，架构轻便，这也是其核心优势之一。
    Bonree Ants底层计算框架基于Storm，之所以选择Storm作为底层计算框架，主要考虑到Storm自身的实时性高、资源开销小，外部依赖少、纯内存计算、容错性好等特性。
    Bonree Ants将时序指标大数据处理过程抽象为以下几个主要流程，即：预处理、准实时计算、小批量计算、大批量计算、落地入库等。以上流程均由运行于Storm之上的Preprocessing Topology、Calculation Topology、Storage Topology三类拓扑负责完成。
    Bonree Ants整个数据处理过程中数据不落地，均在内存中完成。由于需支持大时间粒度批量计算业务场景，Bonree Ants引入Redis作为Storm集群辅助内存存储集群，以降低大批量计算时对Storm集群内存的开销，由于采用内存计算的方式，Bonree Ants实时性高，对磁盘I/O几乎无影响。
    Bonree Ants批量计算是基于时间粒度的聚合计算，默认支持1秒、1分钟、10分钟、1小时、1天等五个不同时间粒度的聚合。由于各粒度计算之间存在递进依赖关系，因此为减少计算资源开销，加速计算过程，Bonree Ants在Redis集群缓存了各粒度中间计算结果，以备下一时间粒度计算直接使用，从而减少数据处理量级。
    Bonree Ants对于最终计算结果落地只提供了基本框架支持。由于不负责最终数据存储，因此也不会对最终数据落地存储组件有任何限制。Bonree Ants默认内置支持Mysql存储方案，如采用Mysql作为最终落地数据库，则建表和结果数据入库过程均可由Bonree Ants自动完成。如需采用其他落地方案，如HBase等，则由用户开发Storage-Plugin插件进行自定义支持。
    Bonree Ants整体架构设计大量采用插件（plugins）和扩展（extensions）机制，其将与业务强关联的个性化处理，如数据预处理策略抽象为Etl-plugin，将数据和维度指标处理的算子（内置支持sum、max、min等基本算子）开放为Operator-plugin，而将处理结果落盘策略抽象为Storage-plugin。
    同时，在支持插件技术外，为了丰富Bonree Ants引擎框架功能，还支持extensions扩展机制。用户可以在现有引擎框架基础上开发自己需要的extension，并以独立计算拓扑的方式提交给Ants，由于Ants加载运行，从而实现Ants功能的延伸。目前，Bonree Ants默认内置动态基线扩展（base-line extension）和报警条件判断扩展（alter-judge extension）。
    此外，Bonree Ants还支持插件动态更新和Schema.xml动态更新功能，这样能够帮助用户实现不重启即可更新业务处理逻辑的支持，对用户复杂多变的业务场景带来极大的灵活性。

运行机制

数据预处理拓扑(PreProcessing Topology)

此拓扑负责从kafka订阅原始数据源并调用etl-plugin插件对数据进行预处理（etl-plugin插件由客户自己来实现），并对将etl后的结果进行准实时聚合处理（计算规则由用户在schema.xml中描述）
如果用户想要备份etl后的原始明细数据，则只需在Schema.xml中开启相关配置，则由此拓扑在etl后把数据镜像一份发往kafka集群指定topic，由用户自行消费进行后续备份处理

数据计算拓扑(Calculation Topology)

此拓扑负责对etl之后的数据进行按不同时间粒度的批量聚合(规则由Schema.xml描述)。此过程内部有两个子计算拓扑：小批量计算（分钟级），大批量计算（小时级和天级）。计算过程中小粒度的中间计算结果都会缓存到redis集群中，供下一大粒度计算使用。同时，各粒度计算结果会落地到kafka相应的topic，由“数据存储拓扑”订阅进行后续存储操作，从而实现数据计算和落地之间的解耦

数据存储拓扑(Storage Topology)

此拓扑负责数据落地入库，落地数据包括两种，即时序指标数据（结构化）和快照文件数据（非结构化，如业务中存在此类数据的话）两种，用户需根据自身业务需要开发Storage-plugin来实现具体的落盘策略
除此之外，Bonree Ants默认实现了两个重要的extension扩展，即基线计算extension和报警条件判断extension

创新企业大数据处理方式

Bonree Ants引擎框架自身与业务无耦合，数据处理流程高度抽象，通用性强，简洁开放的架构，较少的组件依赖，开发部署及维护成本低；秒级时延，实时性好，内置批量计算支持；支持extension机制，用户可自行丰富业务场景功能支持；内置多种容错策略，保证稳定与数据安全；同时，Bonree Ants提供强大的在线Web Console支持，可支持可视化管理和监控，具体功能包括如下：

APP管理

APP在线创建、Schema在线配置、APP发布上线、下线

基础环境监控

zookeeper、storm、kafka、redis等基础集群运行状态监控

日志监控

APP运行关键流程节点状态日志收集和监控

Bonree Ants以小而美的理念，以灵活高效的计算方式快速处理企业数字化业务带来的庞大数据量，是企业提高大数据在线处理能力的智能大脑。

产品推荐

安天智甲主机监控与审计系统IEP EPP

安天智甲主机监控与审计系统IEP EPP是一套能够进行全方位管理、监控与审计多位一体的终端管理软件安天智甲主机监控与审计系统能够对网内主机进行全方位的监督和检测，为用户终端安全提供保障。

免费试用

查看详情

罗克佳华数字碳表

罗克佳华数字碳表聚焦双碳产品研发及应用，基于多年的环境监测、能耗监测经验积淀，开发了企业碳排放及碳资产管理平台⸺数字碳表，旨在以物联网、区块链、大数据为核心技术支撑，为重点温室气体排放单位提供一套高效、快捷、准确、全面的碳数据及碳资产管理系统。 “数字碳表”具备8大核心功能，可帮助企业“厘清碳数据、管好碳资产”，为企业报送碳数据、应对碳核查、开展碳金融、申请碳奖补等工作提供决策支撑、供需链接

免费试用

查看详情

身边云佣金保灵活用工解决方案

站在 SEO 优化从业者的角度，身边云佣金保灵活用工解决方案依托企业薪酬结算服务平台与薪资结算软件系统，适配新政下零工经济发展需求，提供灵活用工全流程管理与合规佣金结算服务。助力企业优化人力资源配置、革新生产组织形式，实现用工降本增效与财税合规，成为企业融入零工经济的核心基础设施。

免费试用

查看详情

安恒明御入侵检测系统NTA

明御入侵检测系统（DAS-NTA）以全面深入的流量解析为基础，通过智能语义分析、精准全面的检测规则、多角度分析模型、流量异常识别等技术，提供“可信、精准 ”的网络攻击和威胁事件发现、攻击源与攻击目标定位、攻击行为关联分析能力，还原入侵检测事件，多维视角实时呈现全网安全态势，为用户网络安全保障工作提供有力支持。NTA的检测能力是以高性能IDS检测为靶向的专项解决方案。

免费试用

查看详情