立即咨询

电话咨询

微信咨询

立即试用
商务合作

腾讯存算分离数据湖解决方案

腾讯存算分离数据湖解决方案,TBDS多引擎多集群支持Ozone、COS等存储,存储集群的单独部署,实现存算分离。TBDS集成SuperSQL,为数据湖(Hadoop)和数仓(MPP)提供统一的SQL中间件,实现融合计算。通过数据湖直接为Tione/太极、DataInsight提供数据,满足交互式分析、机器学习、数据挖掘等场景。
立即咨询
icon腾讯存算分离数据湖解决方案简介icon
存算分离:TBDS多引擎多集群支持Ozone、COS等存储,存储集群的单独部署,实现存算分离。TBDS集成Alluxio,存储挂载支持TBDS-HDFS、Ozone、COS等,并向上支持Hive、Spark、Presto等计算引擎。计算/存储容器化部署,灵活扩容:利用Ozone分布式对象存储和大数据存储的特性实现存储计算的分离。TBDS计算集群容器化,实现计算资源灵活扩容。TBDS集成Tbase/PG,构建数仓,面向上层数仓建设和数据服务。融合分析、开发工具:TBDS集成SuperSQL,为数据湖(Hadoop)和数仓(MPP)提供统一的SQL中间件,实现融合计算。Wedata工具链为数据湖和数仓提供统一的工具,满足数据入湖、数据分析、数仓构建、数据治理和数据服务等场景。通过数据湖直接为Tione/太极、DataInsight提供数据,满足交互式分析、机器学习、数据挖掘等场景。
icon解决方案的价值icon
icon数据湖的应用场景icon

数据湖应用主要分布于泛互联网(电商、网络广告、社交媒体、游戏、互联网金融等)、泛政务(智慧城市、智慧政府、交通等)、金融(银行、保险等)、工业(工业互联网、能源、制造等)、医疗(基因、影像治疗、诊断等)、汽车(车联网等)以及零售、运营商等其他行业。

icon数据湖的应用场景icon
icon腾讯云数据湖发展历程:十年磨一剑,历经四代演进icon
icon腾讯云对于Apache社区的贡献icon

腾讯主导发布了Hadoop 2.8.4、2.8.5、Spark 2.3.2和Ozone1.0等,也是多个项目的核心贡献者,包括Hadoop 、Spark 、Alluxio、Iceberg、HBase、Hive、MXNet、Parquet等。

icon信创国产化平台icon

腾讯云参与多项工委会信创标准和案例评选工作,作为唯一金融大数据解决方案入选《2020年信息技术应用创新解决方案》。与多家国产服务器、国产芯片和国产操作系统厂商建立合作,并进行适配改造,国产化生态丰富。

icon工信部信息技术应用创新解决方案icon
icon腾讯云数据湖方案优势总结icon
完善的服务支持体系:提供高级现场技术服务+远程技术服务,具备完善的售后服务支撑体系。2小时应急响应,专家现场支持,Apache Hadoop PMC技术专家支持,10多位10+年银行行业数据专家支持,7*24小时热线电话。开放的技术体系:开放生态,保护既有投入资产,全面提升服务交付质量。乐高式组件化设计,可复用行里已有数据产品投资。兼容开源Hadoop,原有Hadoop集群数据,脚本,作业无缝迁移,降低重复开发。学习成本低,市场Apache Hadoop技术人才资源丰富,方便技术人才获取。市场顶级金融行业生态合作伙伴应用开发支持。 完整的知识培训体系:借助知识培训体系,通过“扶上马,送一程”机制帮助客户完成知识转移。现场培训,远程培训,视频课件,论坛沙龙。
icon主要客户icon
icon腾讯云内部数据湖平台应用实践icon
icon腾讯内部云原生数据湖架构示例icon
icon腾讯音乐业务痛点icon

基于Lambda框架搭建的数据处理和分析平台,两套独立实现,维护成本高。业务数据不断变化,业务方每天将业务数据全量导入到数仓中一次,但是频繁导入数仓会造成极大的业务压力,数据应用时延为T+1。同时缺乏高性能的交互式查询引擎,对于海量数据的查询时间在分钟级(分钟-数十分钟),无法对接报表工具进行高效分析。离线链路问题:整体方案是t+1,不能解决时效性问题。Clickhouse 不支持ACID事务,通过外部逻辑保证clickhouse中数据不重复,流程加长。实时链路问题:使用Oceanus ,计算后把指标数据落地到mysql,一旦指标增加和变化,Oceanus应用计算逻辑需要修改。

icon腾讯音乐数据湖解决方案及业务价值icon
数据实时入湖
binlog的流式增量入湖,延时降低到30秒以内
秒级查询、分钟级数据分析
入湖的数据对下游实时可见,下游通过Presto秒级查,端到端的数据分析、展示时间缩短到分钟级
实时应用效果提升
推荐歌曲、引导付费、广告等实时业务推送更加精准、秒级完成
icon腾讯新闻业务痛点icon
海量数据,数据源多元化、数据使用多元化、时效性要求较高、流批兼顾
数据量级庞大
腾讯新闻的文章数据基数庞大,千亿级。腾讯新闻的文章各环节维度众多,多达几百个以上。多维度导致的各个生命周期环节的数据量 线性膨胀,单环多达 日均30-50亿。
数据源类型复杂
全量数据(静态分区表、离线文件),准实时增量,消息流…… 使用场景多样
流式消
批加载 ad-hoc条件检索 准实时update md多维分析
icon腾讯新闻实时数据湖解决方案及业务价值icon
icon成功案例:某国有银行实时数据湖icon

主要目标:实时数据湖取代以hive为主的离线数据湖,统一存储、统一数据查询和服务,该阶段主要关注点:批流融合。

icon某国家传媒数据湖icon
icon某国家传媒湖仓一体icon
icon某电网数据湖整体架构icon
icon某电网建设成果及价值体现icon
链路监控
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
大屏应用
基于微服务开发,实现链路监控,电网总览,供用电总览,指标监测,线损管理,配变运行监测,产业分布,住房空置率。
线损分析
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
数据清洗
按照统一数据模型配置清洗校验规则,清洗结果输出统计和明细数据,异常可追溯。根据异常类型生成对应的工单,形成异常闭环管理。

产品推荐

智安网络MSS安全托管服务
安全托管服务(MSS)是智安网络为企业级用户提供的 7*24 小时网络与信息安全运维服务,同时也能满足用户自主使用安全平台及多云管理灵活自控资产运维能力。
免费试用
查看详情
亿联网络云视频会议系统
亿联网络云视频会议系统,全球化、高可用、异构兼容、功能强大、方案丰富的云视频会议服务平台。支持会议容量包叠加支持端口并发、会议容量包组合,对直播介绍、布局、密码、Logo进行自定义设置,支持5000人超大会议容量包,融合会议&直播双重优势的新型会议模式。
免费试用
查看详情
微联SCRM新零售私域流量运营解决方案
微联SCRM新零售私域流量运营解决方案,针对不同特性客户定制话术,提升转化率。自动标签化用户,用户画像一目了然。系统自动过滤重复好友,提升加粉效率。企业微信账号一屏多开,聊天记录云保存。
免费试用
查看详情
网易易盾账号风险画像
网易易盾账号风险画像,通过海量用户数据的多维挖掘,构建黑产库和风险识别模型,精准识别“风险账号”,为客户对账号进行风控处置提供可靠依据。
免费试用
查看详情