
一个数据中台,三个产品
数据中台不是一套大而全的单体系统,而是三个可独立销售、又能无缝协同的产品。它们自下而上解决数据从「进得来」到「能消费」的每一环,事实源单一、互不臃肿。
三个产品的分工
| 产品 | 定位 | 解答的问题 | 核心产出 |
| DataForge | 数据基础设施平台 | 让数据连得上、搬得动、看得见 | 连接管理+数仓注册 (含内联引擎) +数据入仓 |
| MetaPulse | 企业元数据治理平台 | 让数据可信 | Governed Asset(字段标准+ Glossary + DQC) |
| SemWave | 企业元数据治理平台 | 让可信数据可用、智能可用 | Object / Metric / Query API / Agent Tool |
DataForge
把「数据能用」这件事变成基础设施--让数据连得上、搬得动、看得见。
数仓注册
登记企业的数仓与查询引擎。数仓引用一个引擎,1个引擎可被N个数仓复用;第一期支持Doris+Hive,缺数仓的客户自建单机Doris注册即可。引擎技术参数由平台默认,不暴露给用户。

数据入仓编排 · 4步向导
把源端数据整表搬进数仓ODS,全程零代码、由平台编排SeaTunnel执行。一个入仓任务只需四步:配置数据源连接 → 勾选源库表 → 选目标数仓 → 设定同步方式与调度(全量/增量、手动/定时/持续运行)。


浏览与查询
数据进仓后,直接浏览库表元数据、跑SQL查询。统一的查询入口,用数仓内联引擎执行,上层无需关心底层引擎细节。

MetaPulse
默认客户数据模型正确,仅数据需要治理--专注「标准定义 → 质量落地」的治理闭环。
数据资产纳管
MetaPulse 治理的是 DataForge数仓里已存在的ODS表(界面左下角标注「DataForge 已连接」)。从数仓目录树勾选ODS表纳入治理范围,再挂载到对应业务域下,形成「业务域一表」的治理视图。

数据治理与标准体系
核心理念「标准先行」:对每张表、每个字段,定义它「应该是什么」-- 业务含义、数据标准、语义、数据分级、权限标准全部在此规范下来。标准定义清楚,数据口径即统一,也为后续质量检测打下基础。


数据分级
采用全局唯一的「国家数据分级模型」,五个级别,所有业务域共用,由管理员维护、全员只读,对齐国标合规要求。

业务术语 Glossary
字段标准可升级为业务术语,沉淀成企业统一的Glossary。跨表、跨域绑定同一术语后口径即被锁定,彻底消除同一指标各算各的」。术语支持新建、从字段标准升级、以及绑定已有术语三种方式。


数据质量检测 DQC
MetaPulse最具价值的一环 - 质量内生:前面定义的数据标准自动编译为质量检测规则,无需人工编写SQL。系统直接生成检测语句、选定检测对象、运行并产出质量结果。标准定到哪,质量就检到哪。

用户与权限
二元角色模型(管理员/普通用户)+业务域级数据权限。管理员把团队/个人绑定到业务域,普通用户只能看到有权限的业务域及其下属资产、术语、质量范围。管理员授权在MetaPulse统一完成,三个产品共享统一身份目录。

SemWave
让可信数据可用、智能可用把治理过的数据组织成业务语义,直供BI与 AI Agent。
从治理资产到语义消费的6层管线
SemWave 向下依赖 DataForge (执行查询、创建物化表) 与 MetaPulse (拉取 Governed Asset 治理资产),向上以APl形态把可信数据交付给业务消费层。第一期SemWave为规划中的语义层,下方为其能力管线示意。

三层协同:一个完整的数据中台闭环
从客户既有数据源,到 BI与AI Agent可直接消费的可信指标,三个产品各司其职、首尾相接,构成「可见 → 可信 → 可用」的端到端闭环。

为什么是三个产品,而不是一个
让数据从「能用」走到「可信」与「可用」
DataForge让数据连得上、搬得动、看得见;MetaPulse让数据可信;SemWave让可信数据可用、智能可用。一纵到底,构成企业级数据中台的完整闭环。



