icon腾讯存算分离数据湖解决方案简介icon
存算分离:TBDS多引擎多集群支持Ozone、COS等存储,存储集群的单独部署,实现存算分离。TBDS集成Alluxio,存储挂载支持TBDS-HDFS、Ozone、COS等,并向上支持Hive、Spark、Presto等计算引擎。计算/存储容器化部署,灵活扩容:利用Ozone分布式对象存储和大数据存储的特性实现存储计算的分离。TBDS计算集群容器化,实现计算资源灵活扩容。TBDS集成Tbase/PG,构建数仓,面向上层数仓建设和数据服务。融合分析、开发工具:TBDS集成SuperSQL,为数据湖(Hadoop)和数仓(MPP)提供统一的SQL中间件,实现融合计算。Wedata工具链为数据湖和数仓提供统一的工具,满足数据入湖、数据分析、数仓构建、数据治理和数据服务等场景。通过数据湖直接为Tione/太极、DataInsight提供数据,满足交互式分析、机器学习、数据挖掘等场景。
icon解决方案的价值icon
icon数据湖的应用场景icon

数据湖应用主要分布于泛互联网(电商、网络广告、社交媒体、游戏、互联网金融等)、泛政务(智慧城市、智慧政府、交通等)、金融(银行、保险等)、工业(工业互联网、能源、制造等)、医疗(基因、影像治疗、诊断等)、汽车(车联网等)以及零售、运营商等其他行业。

icon数据湖的应用场景icon
icon腾讯云数据湖发展历程:十年磨一剑,历经四代演进icon
icon腾讯云对于Apache社区的贡献icon

腾讯主导发布了Hadoop 2.8.4、2.8.5、Spark 2.3.2和Ozone1.0等,也是多个项目的核心贡献者,包括Hadoop 、Spark 、Alluxio、Iceberg、HBase、Hive、MXNet、Parquet等。

icon信创国产化平台icon

腾讯云参与多项工委会信创标准和案例评选工作,作为唯一金融大数据解决方案入选《2020年信息技术应用创新解决方案》。与多家国产服务器、国产芯片和国产操作系统厂商建立合作,并进行适配改造,国产化生态丰富。

icon工信部信息技术应用创新解决方案icon
icon腾讯云数据湖方案优势总结icon
完善的服务支持体系:提供高级现场技术服务+远程技术服务,具备完善的售后服务支撑体系。2小时应急响应,专家现场支持,Apache Hadoop PMC技术专家支持,10多位10+年银行行业数据专家支持,7*24小时热线电话。开放的技术体系:开放生态,保护既有投入资产,全面提升服务交付质量。乐高式组件化设计,可复用行里已有数据产品投资。兼容开源Hadoop,原有Hadoop集群数据,脚本,作业无缝迁移,降低重复开发。学习成本低,市场Apache Hadoop技术人才资源丰富,方便技术人才获取。市场顶级金融行业生态合作伙伴应用开发支持。 完整的知识培训体系:借助知识培训体系,通过“扶上马,送一程”机制帮助客户完成知识转移。现场培训,远程培训,视频课件,论坛沙龙。
icon主要客户icon
icon腾讯云内部数据湖平台应用实践icon
icon腾讯内部云原生数据湖架构示例icon
icon腾讯音乐业务痛点icon

基于Lambda框架搭建的数据处理和分析平台,两套独立实现,维护成本高。业务数据不断变化,业务方每天将业务数据全量导入到数仓中一次,但是频繁导入数仓会造成极大的业务压力,数据应用时延为T+1。同时缺乏高性能的交互式查询引擎,对于海量数据的查询时间在分钟级(分钟-数十分钟),无法对接报表工具进行高效分析。离线链路问题:整体方案是t+1,不能解决时效性问题。Clickhouse 不支持ACID事务,通过外部逻辑保证clickhouse中数据不重复,流程加长。实时链路问题:使用Oceanus ,计算后把指标数据落地到mysql,一旦指标增加和变化,Oceanus应用计算逻辑需要修改。

icon腾讯音乐数据湖解决方案及业务价值icon
数据实时入湖
binlog的流式增量入湖,延时降低到30秒以内
秒级查询、分钟级数据分析
入湖的数据对下游实时可见,下游通过Presto秒级查,端到端的数据分析、展示时间缩短到分钟级
实时应用效果提升
推荐歌曲、引导付费、广告等实时业务推送更加精准、秒级完成
icon腾讯新闻业务痛点icon
海量数据,数据源多元化、数据使用多元化、时效性要求较高、流批兼顾
数据量级庞大
腾讯新闻的文章数据基数庞大,千亿级。腾讯新闻的文章各环节维度众多,多达几百个以上。多维度导致的各个生命周期环节的数据量 线性膨胀,单环多达 日均30-50亿。
数据源类型复杂
全量数据(静态分区表、离线文件),准实时增量,消息流…… 使用场景多样
流式消
批加载 ad-hoc条件检索 准实时update md多维分析
icon腾讯新闻实时数据湖解决方案及业务价值icon
icon成功案例:某国有银行实时数据湖icon

主要目标:实时数据湖取代以hive为主的离线数据湖,统一存储、统一数据查询和服务,该阶段主要关注点:批流融合。

icon某国家传媒数据湖icon
icon某国家传媒湖仓一体icon
icon某电网数据湖整体架构icon
icon某电网建设成果及价值体现icon
链路监控
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
大屏应用
基于微服务开发,实现链路监控,电网总览,供用电总览,指标监测,线损管理,配变运行监测,产业分布,住房空置率。
线损分析
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
数据清洗
按照统一数据模型配置清洗校验规则,清洗结果输出统计和明细数据,异常可追溯。根据异常类型生成对应的工单,形成异常闭环管理。
产品推荐 查看更多>>
    腾讯教育应用平台License

    腾讯教育应用平台License,基于教育AI技术,整合优质学习资源和内容,提供个性化做题、微课讲解、错题本巩固等学科学习服务,同时拓展英语口语阅读、人工智能编程等素质类学习服务。助力传统平板厂商升级为教育平板+助力已有教育平板升级服务能力,提高终端溢价,带来更多商业回报。

    整合优质学习资源和内容

    提供个性化做题等学科学习服务

    拓展英语口语阅读等素质类学习服务

    助力已有教育平板升级服务能力

    腾讯RayData数据可视化分析平台

    RayData Report数据可视化分析平台,从业务需求入手,助力高校师生通过无代码、鼠标一键拖拉拽、所见即所得的方式构建学校各类型数据可视化应用。平台提供丰富的图表展现方式、业务模型和可视化模板,快速实现专题业务数据可视化表达,让每个人都能轻松的参与数据可视化的制作、交互、共享、决策。

    助力高校师生通过无代码、鼠标一键拖拉拽

    所见即所得的方式构建学校各类型数据可视化应用

    提供丰富的图表展现方式、业务模型和可视化模

    让每个人都能轻松的参与数据可视化的制作、交互、共享、决策

    腾讯电子签文旅行业解决方案

    腾讯电子签文旅行业解决方案,为文旅企业提供便捷、安全、合法的线上签约服务,通过合同数字化助力降本增效!

    为文旅企业提供便捷、安全、合法的线上签约服务

    通过合同数字化助力降本增效

    完善小程序生态,15秒在线完成签署

    高效合法的“至信链”存证能力