
什么是 TDSQL HTAP
TDSQL HTAP解决方案是对腾讯云企业级分布式数据库TDSQL 2.0 的升级。主要满足客户高并发的交易型数据处理的同时又支持实时的数据统计分析诉求。内核:兼顾超强分析性能,数据一致性以及负载隔离性。部署:一键部署,按需扩展,灵活扩展HTAP能力。易用:一体化的产品实现,丰富的场景适配,低学习和使用成本。

为什么需要TDSQL HTAP
TDSQL 在多表Join查询,复杂关联性查询,分布式并行计算,大数据批处理场景下性能薄弱!

为何升级为TDSQL HTAP
One Design Not For all : 当前TDSQL为极致 TP 性能优化的设计,在混合负载/分析场景下面临挑战。举例:在金融行业中解决原先监管报送、日终跑批等性能薄弱的场景,以支撑全流程的业务场景。

TDSQL HTAP 架构

TDSQL HTAP 架构特点
为什么性能好?-- 列式存储
为什么性能好?- 列存实现机制
为什么性能好?-- 高性能随机读写

为什么性能好?-- 高负载情况下性能稳定性1

高负载情况下性能稳定性-- 基于列亲和的文件优化

高负载情况下性能稳定性--文件合并优化

为什么性能好?-表join性能优化与MPP
在多张大表join场景下,引入shuffle join 支持,通过分而治之的思想提升多表join性能。而多表shuffle 则需要采用MPP的技术并行处理,避免顺序执行排队。目前支持的物理算法有:Boardcast hash join、shuffle hash join,shuffle hash aggregation、TopN、Limit、windows function。

为什么性能好?-向量化执行引擎

高性能存储的成本优势- 压缩率
librastore 默认采用lz4 的底层数据压缩方案,以满足高速数据的数据读取和解压缩性能。 对比CSV文件压缩率为58%

松耦合架构--保证负载隔离性
采用资源隔离的方案部署行存节点与列存节点,在AP类SQL执行时不会影响在线交易事务的处理。Product1cp 和2cp 采用了单副本和多副本读写分离的模式。Product1ar和2ar 是一种存储结构支撑HTAP的架构,采用强读和弱读的方式进行测试的结果。TDSQL 采用 V2版读写分离与HTAP版本分别进行测试。可以明显看到基于松耦合架构实现的 Product 1 和TDSQL HTAP的隔离性最好。

成本低- 可插拔式分析引擎
可根据业务自身情况随时开启或关闭HTAP能力,支持分析引擎各组件规格自由调整,更充分的利用资源。支持指定对象的分析加速,无需整理同步,极大节省存储空间。

更易用- TDSQL 兼容性与统一入口
高可用 – 两种高可用方案

数据实时性保证-数据复制层架构
数据实时性保证-断点续传能力实现

特殊扩展能力– 多源数据汇聚合一
性能数据

应用场景- 流批一体大数据架构替换

应用场景- 数据跑批归档与定时报表业务
客户:某银行-核心网贷业务,超高并发交易,定时跑批,实时分析

应用场景- 超大数据规模HTAP混合查询业务
应用场景- 数据降级/归档分析场景

分析引擎LibraDB 公有云运营情况
Libra 客户案例 腾讯内部某业务
腾讯某业务,为企业提供会议,在线课堂、考试、学习地图、直播、文档、问卷调研等多项应用服务。疫情期间为学校、医院、政府、企业等多行业正常运行提供 SaaS 基础服务。

Libra 客户案例
LibraCDC:事务一致性查询处理

解决思路:全链路 MVCC

ts 生成: LibraStore 内核维护
LibraStore 内置逻辑时钟模块,为每个写入事务消息分配递增时间戳,查询 ts 由LibraDB内部维护,LibraCDC 在事务边界更新查询 ts。




