icon产品优势icon
轻量的代码开发
向导化定义输入输出,快捷实现业务需求;降低学习成本,屏蔽底层技术,聚焦流分析本身
可靠的计算引擎
基于业界开源的流计算框架,Exactly-Once语义保证数据一致性,具有吞吐量高、时效性强等特性
安全的权限隔离
支持多租户隔离,租户建安全机制保障,确保作业安全运行;支持项目间的数据权限隔离,保障数据的安全性
灵活的底层适配
支持多种大数据存储计算平台,支持底层集群、Flink connector插件化开发
icon核心功能icon
实时同步
支持异构数据源,可视化拖拽,脏数据管理
实时计算
SQL化开发,支持参数调优,多流多维表jion,多引擎版本
运维监控
丰富的metrics监控指标,支持作业消费延迟告警及脏数据管理、实时掌控作业运行状态
统一发布
支持多级环境级联发布,保障开发环境、预发环境、生产环境的隔离
icon实时数仓的应用场景icon
实时OLAP分析
扩展现有OLAP分析工具,支持实时数据分析
实时计算特征
实时计算实体特征,进行精准运营
实时数据看板
实时播报核心数据
实时业务监控
核心业务指标实时监控,预警
icon业务流程icon
实时数仓的整体架构
数仓层次更少
尽量减少层次的划分,应用层数据直接写入应用数据库,仓库内不维护应用层
多种数据源存储
实时数仓使用Kafka存储明细与汇总数据,Redis、HBase等缓存存储维度数据
icon业务流程icon
实时数仓的整体架构
实时数仓其实是从 Hive+HDFS 的组合换成了 Kafka,ETL 的功能通过 Flink 的流式处理解决。面临问题: 历史数据丢失,因为 Kafka 只是临时的存储介质,数据会有一个超时的时间 (比如只保存 7 天的数据),这会导致我们的历史数据丢失。
icon业务流程 实时数仓DWD明细层icon

解决原始数据中数据存在噪声、不完整和数据形式不统一的情况。形成规范,统一的数据源。如果可能话尽可能和离线保持一致。

icon业务流程icon
实时数仓DIM维度层
变化频率低的维度:如地理、节假日等
可以通过将离线仓库的维表数据同步到缓存,或者通过公共服务提取数据。最后通过维度服务查询,对用户屏蔽细节。
变化频率高的维度:如商品价格、新老客等
通过维度数据的变化消息构建拉链表。
通过事实数据计算衍生维度构建拉链表。
icon业务流程 实时数仓DWS汇总层icon
对共性指标统一加工
大数据去重指标计算时,可以考虑使用非精确去重减少内存使用
Flink丰富的时间窗口
使用时间窗口后,要设置对应的State的TTL设置
根据主题进行多维汇总
直接使用group by语句,需要转化成append流才能写入Kafka
衍生维度的统一加工
可以利用HBase的版本机制构建实时维表
icon解决方案 实时数仓的概念映射icon
icon解决方案 实时数仓的Lambda架构icon
icon解决方案icon
实时数仓的Kappa架构
Kappa架构可以认为是Lambda架构的简化版(只要移除Lambda架构中的批处理部分即可)。在Kappa架构中,需求修改或历史数据重新处理都通过上游重放完。Kappa架构最大的问题是流式重新处理历史的吞吐能力会低于批处理,但这个可以通过增加计算资源来弥补。
icon解决方案 基于Flink实时数仓的整体设计icon
icon解决方案 基于Flink实时数仓的数据模型icon
icon方案实施 基于Flink实时数仓的功能结构icon
icon流批一体探索:统一元数据icon

把 Kafka 表的元数据信息存储到 HiveMetaStore 中,做到离线和实时的表 Meta 的统一。

icon流批一体探索:统一计算引擎icon
同一套 SQL,Flink自身提供批流一体的 ANSI-SQL 语法,可以大大减小用户 SQL 开发者和运维者的负担,让用户专注于业务逻辑。
同一个引擎,Flink的流和批复用一套优化和 Runtime 框架,一套引擎可以让开发者专注单个技术栈,避免需要接触多个技术栈,而只有技术广度,没有技术深度。
icon流批一体探索: 统一数据icon
实时 Kafka 表可以实时的同步到对于的离线表中。
离线表作为实时的历史数据,填补了实时数仓不存在历史数据的空缺。
数据批量准实时摄入为 Ad-hoc 查询离线表提供了准实时输入。
产品推荐 查看更多>>
    Tableau—嵌入式分析

    借助功能强大的自助嵌入式分析解决方案,轻松定制、集成和直接部署到应用程序、产品和Web门户,从而创建新的收入流,并在此瞬息万变的环境中为您的客户和合作伙伴带来价值。

    最佳的BI体验

    提高收入和用户粘度

    快速构建

    海致星图知识图谱分析平台

    海致星图知识图谱分析平台,创建自己的场景图谱、接入或定制行业知识图谱应用,提供服务共享的在线协作方式。提供实时图查询、离线图查询、场景探索等分析能力,支持基于项目与组织的功能和数据权限控制。支持主流大数据平台、图数据库以及查询语言的适配。

    实时图查询

    在线协作

    知识构建

    集群部署

    千瓦科技综合能源服务平台

    千瓦科技综合能源服务平台基于万物互联数字底座,一个平台管理工厂能源、设备、生产、品质、安全、环境等模块。提供PC、移动端巡检、日志、缺陷、工单等运维服务工具,备件管理等。AI分析引擎提供能耗分析、碳排放、节能减排、智能排班、品质改善、售电预测等功能。

    视频监控

    设备监控

    生产监控

    光伏平台