icon产品优势icon
轻量的代码开发
向导化定义输入输出,快捷实现业务需求;降低学习成本,屏蔽底层技术,聚焦流分析本身
可靠的计算引擎
基于业界开源的流计算框架,Exactly-Once语义保证数据一致性,具有吞吐量高、时效性强等特性
安全的权限隔离
支持多租户隔离,租户建安全机制保障,确保作业安全运行;支持项目间的数据权限隔离,保障数据的安全性
灵活的底层适配
支持多种大数据存储计算平台,支持底层集群、Flink connector插件化开发
icon核心功能icon
实时同步
支持异构数据源,可视化拖拽,脏数据管理
实时计算
SQL化开发,支持参数调优,多流多维表jion,多引擎版本
运维监控
丰富的metrics监控指标,支持作业消费延迟告警及脏数据管理、实时掌控作业运行状态
统一发布
支持多级环境级联发布,保障开发环境、预发环境、生产环境的隔离
icon实时数仓的应用场景icon
实时OLAP分析
扩展现有OLAP分析工具,支持实时数据分析
实时计算特征
实时计算实体特征,进行精准运营
实时数据看板
实时播报核心数据
实时业务监控
核心业务指标实时监控,预警
icon业务流程icon
实时数仓的整体架构
数仓层次更少
尽量减少层次的划分,应用层数据直接写入应用数据库,仓库内不维护应用层
多种数据源存储
实时数仓使用Kafka存储明细与汇总数据,Redis、HBase等缓存存储维度数据
icon业务流程icon
实时数仓的整体架构
实时数仓其实是从 Hive+HDFS 的组合换成了 Kafka,ETL 的功能通过 Flink 的流式处理解决。面临问题: 历史数据丢失,因为 Kafka 只是临时的存储介质,数据会有一个超时的时间 (比如只保存 7 天的数据),这会导致我们的历史数据丢失。
icon业务流程 实时数仓DWD明细层icon

解决原始数据中数据存在噪声、不完整和数据形式不统一的情况。形成规范,统一的数据源。如果可能话尽可能和离线保持一致。

icon业务流程icon
实时数仓DIM维度层
变化频率低的维度:如地理、节假日等
可以通过将离线仓库的维表数据同步到缓存,或者通过公共服务提取数据。最后通过维度服务查询,对用户屏蔽细节。
变化频率高的维度:如商品价格、新老客等
通过维度数据的变化消息构建拉链表。
通过事实数据计算衍生维度构建拉链表。
icon业务流程 实时数仓DWS汇总层icon
对共性指标统一加工
大数据去重指标计算时,可以考虑使用非精确去重减少内存使用
Flink丰富的时间窗口
使用时间窗口后,要设置对应的State的TTL设置
根据主题进行多维汇总
直接使用group by语句,需要转化成append流才能写入Kafka
衍生维度的统一加工
可以利用HBase的版本机制构建实时维表
icon解决方案 实时数仓的概念映射icon
icon解决方案 实时数仓的Lambda架构icon
icon解决方案icon
实时数仓的Kappa架构
Kappa架构可以认为是Lambda架构的简化版(只要移除Lambda架构中的批处理部分即可)。在Kappa架构中,需求修改或历史数据重新处理都通过上游重放完。Kappa架构最大的问题是流式重新处理历史的吞吐能力会低于批处理,但这个可以通过增加计算资源来弥补。
icon解决方案 基于Flink实时数仓的整体设计icon
icon解决方案 基于Flink实时数仓的数据模型icon
icon方案实施 基于Flink实时数仓的功能结构icon
icon流批一体探索:统一元数据icon

把 Kafka 表的元数据信息存储到 HiveMetaStore 中,做到离线和实时的表 Meta 的统一。

icon流批一体探索:统一计算引擎icon
同一套 SQL,Flink自身提供批流一体的 ANSI-SQL 语法,可以大大减小用户 SQL 开发者和运维者的负担,让用户专注于业务逻辑。
同一个引擎,Flink的流和批复用一套优化和 Runtime 框架,一套引擎可以让开发者专注单个技术栈,避免需要接触多个技术栈,而只有技术广度,没有技术深度。
icon流批一体探索: 统一数据icon
实时 Kafka 表可以实时的同步到对于的离线表中。
离线表作为实时的历史数据,填补了实时数仓不存在历史数据的空缺。
数据批量准实时摄入为 Ad-hoc 查询离线表提供了准实时输入。
产品推荐 查看更多>>
    数云全渠道消费者运营系统

    数云全渠道消费者运营系统,帮助企业打通全渠道消费者数据,打破数据孤岛,积累一方数据资产,帮助企业搭建全渠道会员忠诚度体系,阶梯性成长持续提升会员转化和粘性。帮助企业实现全旅程精准智能营销,优化消费体验,提升客户价值。

    触点覆盖全面

    评估渠道获客能力

    改善用户使用体验

    实时数据赋能策略优化

    万店掌客流数据统计分析系统

    万店掌客流数据统计分析系统,一机多用,店外客流统计+进店客流统计,支持分类统计人员进入、离开、经过客流统计。部署在卖场各出入口上方,基于人形轮廓识别和跟踪技术,进行精准的人员计数。分析客流性别比例、年龄分布、消费特点、产品关注度、商品热度等。

    一机多用

    跟踪技术

    轮廓识别

    消费特点

    识庐慧图Graph AI关联计算平台

    识庐慧图Graph AI关联计算平台,基于擎苍lite模型构建工具,为客户打造贴合业务场景的模型,交付效率快,标准化程度高。基于识庐慧图标准化Graph AI模型的良好效果,为后续更多业务场景铺平智能化转型之路。

    部署擎苍lite建模工具

    模型图数据构建

    范式化建模

    lite模型管理组件