立即咨询

电话咨询

微信咨询

立即试用
商务合作

腾讯存算分离数据湖解决方案

腾讯存算分离数据湖解决方案,TBDS多引擎多集群支持Ozone、COS等存储,存储集群的单独部署,实现存算分离。TBDS集成SuperSQL,为数据湖(Hadoop)和数仓(MPP)提供统一的SQL中间件,实现融合计算。通过数据湖直接为Tione/太极、DataInsight提供数据,满足交互式分析、机器学习、数据挖掘等场景。
立即咨询
icon腾讯存算分离数据湖解决方案简介icon
存算分离:TBDS多引擎多集群支持Ozone、COS等存储,存储集群的单独部署,实现存算分离。TBDS集成Alluxio,存储挂载支持TBDS-HDFS、Ozone、COS等,并向上支持Hive、Spark、Presto等计算引擎。计算/存储容器化部署,灵活扩容:利用Ozone分布式对象存储和大数据存储的特性实现存储计算的分离。TBDS计算集群容器化,实现计算资源灵活扩容。TBDS集成Tbase/PG,构建数仓,面向上层数仓建设和数据服务。融合分析、开发工具:TBDS集成SuperSQL,为数据湖(Hadoop)和数仓(MPP)提供统一的SQL中间件,实现融合计算。Wedata工具链为数据湖和数仓提供统一的工具,满足数据入湖、数据分析、数仓构建、数据治理和数据服务等场景。通过数据湖直接为Tione/太极、DataInsight提供数据,满足交互式分析、机器学习、数据挖掘等场景。
icon解决方案的价值icon
icon数据湖的应用场景icon

数据湖应用主要分布于泛互联网(电商、网络广告、社交媒体、游戏、互联网金融等)、泛政务(智慧城市、智慧政府、交通等)、金融(银行、保险等)、工业(工业互联网、能源、制造等)、医疗(基因、影像治疗、诊断等)、汽车(车联网等)以及零售、运营商等其他行业。

icon数据湖的应用场景icon
icon腾讯云数据湖发展历程:十年磨一剑,历经四代演进icon
icon腾讯云对于Apache社区的贡献icon

腾讯主导发布了Hadoop 2.8.4、2.8.5、Spark 2.3.2和Ozone1.0等,也是多个项目的核心贡献者,包括Hadoop 、Spark 、Alluxio、Iceberg、HBase、Hive、MXNet、Parquet等。

icon信创国产化平台icon

腾讯云参与多项工委会信创标准和案例评选工作,作为唯一金融大数据解决方案入选《2020年信息技术应用创新解决方案》。与多家国产服务器、国产芯片和国产操作系统厂商建立合作,并进行适配改造,国产化生态丰富。

icon工信部信息技术应用创新解决方案icon
icon腾讯云数据湖方案优势总结icon
完善的服务支持体系:提供高级现场技术服务+远程技术服务,具备完善的售后服务支撑体系。2小时应急响应,专家现场支持,Apache Hadoop PMC技术专家支持,10多位10+年银行行业数据专家支持,7*24小时热线电话。开放的技术体系:开放生态,保护既有投入资产,全面提升服务交付质量。乐高式组件化设计,可复用行里已有数据产品投资。兼容开源Hadoop,原有Hadoop集群数据,脚本,作业无缝迁移,降低重复开发。学习成本低,市场Apache Hadoop技术人才资源丰富,方便技术人才获取。市场顶级金融行业生态合作伙伴应用开发支持。 完整的知识培训体系:借助知识培训体系,通过“扶上马,送一程”机制帮助客户完成知识转移。现场培训,远程培训,视频课件,论坛沙龙。
icon主要客户icon
icon腾讯云内部数据湖平台应用实践icon
icon腾讯内部云原生数据湖架构示例icon
icon腾讯音乐业务痛点icon

基于Lambda框架搭建的数据处理和分析平台,两套独立实现,维护成本高。业务数据不断变化,业务方每天将业务数据全量导入到数仓中一次,但是频繁导入数仓会造成极大的业务压力,数据应用时延为T+1。同时缺乏高性能的交互式查询引擎,对于海量数据的查询时间在分钟级(分钟-数十分钟),无法对接报表工具进行高效分析。离线链路问题:整体方案是t+1,不能解决时效性问题。Clickhouse 不支持ACID事务,通过外部逻辑保证clickhouse中数据不重复,流程加长。实时链路问题:使用Oceanus ,计算后把指标数据落地到mysql,一旦指标增加和变化,Oceanus应用计算逻辑需要修改。

icon腾讯音乐数据湖解决方案及业务价值icon
数据实时入湖
binlog的流式增量入湖,延时降低到30秒以内
秒级查询、分钟级数据分析
入湖的数据对下游实时可见,下游通过Presto秒级查,端到端的数据分析、展示时间缩短到分钟级
实时应用效果提升
推荐歌曲、引导付费、广告等实时业务推送更加精准、秒级完成
icon腾讯新闻业务痛点icon
海量数据,数据源多元化、数据使用多元化、时效性要求较高、流批兼顾
数据量级庞大
腾讯新闻的文章数据基数庞大,千亿级。腾讯新闻的文章各环节维度众多,多达几百个以上。多维度导致的各个生命周期环节的数据量 线性膨胀,单环多达 日均30-50亿。
数据源类型复杂
全量数据(静态分区表、离线文件),准实时增量,消息流…… 使用场景多样
流式消
批加载 ad-hoc条件检索 准实时update md多维分析
icon腾讯新闻实时数据湖解决方案及业务价值icon
icon成功案例:某国有银行实时数据湖icon

主要目标:实时数据湖取代以hive为主的离线数据湖,统一存储、统一数据查询和服务,该阶段主要关注点:批流融合。

icon某国家传媒数据湖icon
icon某国家传媒湖仓一体icon
icon某电网数据湖整体架构icon
icon某电网建设成果及价值体现icon
链路监控
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
大屏应用
基于微服务开发,实现链路监控,电网总览,供用电总览,指标监测,线损管理,配变运行监测,产业分布,住房空置率。
线损分析
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
数据清洗
按照统一数据模型配置清洗校验规则,清洗结果输出统计和明细数据,异常可追溯。根据异常类型生成对应的工单,形成异常闭环管理。

产品推荐

同创永益IStorMChaos混沌工程平台
同创永益IStorMChaos混沌工程平台提供成熟的实践场景和丰富的故障注入手段,通过对业务系统进行平台、中间件、应用等维度的故障注入实验,并提供提供自动化、智能化的混沌实验和体检套餐,帮助技术团队发现更多未知的业务稳定性隐患,有效的提升业务和系统稳定性。
免费试用
查看详情
蓝鲸自动化运维
蓝鲸自动化运维是一套具有多项探索式创新的,为业务量身打造的,定制化的一站式运维体系,不仅提供了基础运维无人值守服务,还给运维人员提供一系列解决方案(工具),低成本实现增值服务。
免费试用
查看详情
云话科技智能视觉感知平台
云话科技智能视觉感知平台是利用计算机视觉技术,在不需要人为干预的情况下,通过对视频图像进行自动分析,实现对业务场景中目标的定位、 识别和跟踪,并在此基础上分析和判断目标的行为,从而做到既能完成日常管理又可在异常情况发生时及时做出预警告警等响应,辅助决策。
免费试用
查看详情
有赞新零售美妆集合店解决方案
有赞新零售美妆集合店解决方案,三种企微活码,一键布局,轻松引流获客。搭建私域矩阵,培养线上消费习惯,增强顾客粘性。全渠道做好预热宣传,为直播大卖蓄水,线上线下一体化为门店带来更多营销机会。提升门店顾客体验,增加门店营销触点,带来更多转化。
免费试用
查看详情