icon数据是企业的核心资产,如何利用好数据是企业面临的挑战icon

大数据是传统互联网客户的核心业务,是产业互联网数字化转型必由之路,公有云厂商都在加速布局。

某短视频客户,每天线上有上亿的访问量,大量的日志离线和实时作业。主集群已突破千台的规模, 有着超 过100PB的数据量,每日的增量大概在200TB。每天的作业数达到了20万,给存储和计算带来了很 大的挑战。

某电商客户,大数据集群达到1500+台,已使用30+PB的空间,每天运行的任务量接近40万。 在凌晨计算高峰期,最大并发请求量为3万+QPS。

某旅游业客户,每天需要处理的业务日志量大约300亿条,约50TB的数据量。要保证在稳定的低延 时情况下工作,快速迭代计算出结果并反馈到线上业务系统中。如何保证数据的可靠性以及低延时,就成 了整个系统开发和运维工作中的重中之重。

icon随着业务的增长,本地IDC自建、云上自建大数据集群,面临诸多痛点icon

客户希望云厂商能够解决大数据场景下的性能、成本、运维等问题

存储方面

HDFS性能抖动、时延大,业务经常失败;HDFS扩容周期长,存储压力大;HDFS三副本,存储成本高;HDFS停机维护,导致业务无法按时完成

计算方面

数据增长带来硬件扩容,一次性投资增加;资源利用率不高,缺乏弹性;

业务、运维方面

运维工作量大,响应不及时;业务数据处理时间不可控;成本持续增加,财务和业务部门抱怨

icon为什么COS作为数据湖的统一存储icon

针对大数据分析场景,需要COS提供性能加速能力

高可靠、高可用、EB级扩展能力
安全、合规、可审计
高性能
低成本存储和分析
广泛的云上产品生态
icon腾讯云湖仓一体解决方案参考架构icon
icon如何在腾讯云上构建数据湖icon

腾讯云在大力推广数据湖解决方案,帮助客户技术转型。面向大数据业务场景:推荐系统,数字化运营,用户行为分析,风控系统,预测系统。 方案价值:云原生:serverless架构,免运维;流批一体:通过Table Format(Delta Lake,Hudi,Iceberg)支持流批一体;数据共享:打通大数据、AI、BI,消除数据孤岛;高性价比:弹性、按需扩容; 一站式:多元化的数据分析引擎。

icon什么是GooseFSicon

计算端缓存加速:多协议支持:HDFS/FUSE/S3;云原生: 容器化部署/EMR集成;多级缓存:RAM/SSD/HDD;云生态:云监控/云日志/统一鉴权。

iconCOS作为数据湖的统一存储,提供Cache、数据、元数据多种性能加速能力icon
GooseFS:Cache Accelerator

运行在EMR/AI/ML/K8S集群内,基于集群 MEM/SSD资源,提供Data Cache能力;热数据缓存在Cache中,COS保存全量数据;针对各种计算引擎,提供Data Locality能力。

Data Accelerator

AZ级部署,全SSD存储介质,对COS热数据 做读加速;提供Tbps带宽,满足高吞吐需求;提供ms级别时延。

Metadata Accelerator

提供文件系统级别元数据操作能力;Rename操作,无需Copy/Delete数据;List操作,无频控;每个Bucket,提供10万 QPS。

iconGooseFS(Cache Accelerator) – 在计算端,提供数据缓存加速能力icon

Data Cache: 支持Hive Table Level预热,面向业务加速;支持Iceberg Table Leve预热;支持Prefix Level预热,按目录加速;支持多种数据缓存淘汰策略, LRU/LRFU/TTL;支持缓存数据同步/异步写入COS; Metadata Cache:避免了大量的list operations;提高了Metadata 访问性能。

iconGooseFS on EMR/Yarnicon

GooseFS Master: 部署在EMR Master节点,HA部署方式,Master高可靠;一个Master作为Leader,其他Master Standby;通过shared journal确保数据一致性;RocksDB作为Metadata Store,支持海量inode; GooseFS Worker: 每个EMR Core Node部署一个 GooseFS Worker;支持Data Locality;根据计算引擎的调度来Cache对应的 业务数据。

iconGooseFS on Yarn with TensorFlowicon

GooseFS Master:部署在Master节点,HA部署方式, Master高可靠; 一个Master作为Leader,其他Master Standby;通过shared journal确保数据一致性;RocksDB作为Metadata Store,支持海量inode; GooseFS Worker:每个GPU Worker Node部署一个 GooseFS Worker 同TF Worker部署 在一个Node;支持Data Locality;根据计算引擎的调度来Cache对应的 业务数据。

iconGooseFS on TKE/K8Sicon

GooseFS Master:HA部署方式,Master高可靠; 一个Master作为Leader,其他Master Standby;通过shared journal确保数据一致性;RocksDB作为Metadata Store,支持海量inode; GooseFS Worker:通过DaemonSet,确保每个TKE Worker Node部署一个GooseFS Worker Pod;支持Data Locality;根据计算引擎的调度来Cache对应的业务数据。

iconGooseFS – TPC-DS 性能测试icon
icon随着数据量的增长,对比本地盘HDFS,数据湖成本优势明显icon

数据在1PB以下,采用数据湖、本地盘成本区别不大;达到 1PB的时候,出现拐点,数据湖成本优势显现;当数据量持续增长后,本地盘HDFS成本增长迅速,数据湖成本优势显著,对比本地盘HDFS有巨大优势。

iconGooseFS(Cache Accelerator)支持Table Format,提供流批一体数据分析能力icon

支持流式数据通过Table Format(Delta,Hudi,Iceberg)直接写入COS对象存储,并提供Record Level updates and Deletes能力;支持主流计算分析引擎Spark,Presto,Flink,Hive,提供近实时数据分析和查询能力;实现流批一体数据分析平台。

iconCOS 加速器(Data Accelerator)–在AZ端,提供全闪存硬件加速服务icon

数据加速提供Tbps级别带宽资源,ms级别时延,加速大数据、AI业务处理速度

主要功能:AZ Locality;专有加速域名访问资源;缓存数据强一致;可以加速Bucket,或者prefix;同一个Bucket,支持多个加速器;支持存量Bucket,随时 Enable/Disable;如果miss cache,从COS回源。

icon数据加速器(Data Accelerator) – 对Bucket Prefix提供AZ内部加速服务icon

加速能力:Date 加速;读加速 加速流程: ① COS Requests到CGI(COS Gateway Interface) ② CGI根据Prefix路由到对应的AZ COS加速 器;如果对应的Prefix没有被加速,直接 路由请求到COS; ③ 写入请求:Object先写入COS,成功后, Cache到COS加速器中; ④ 读取请求:如果COS加速器中没有对应的 Object,从COS中读取,并Cache到COS 加速器中;如果COS加速器中已经有对应 的Object,直接返回Cache中的数据

icon元数据加速器(Metadata Accelerator)- 在存储端,提供元数据加速服务icon

提供文件系统级别元数据能力,加速 Rename、List等操作,解决大数据、AI业务在对象存储上的元数据QPS瓶颈问题。主要特性:文件系统级别元数据操作;提供Rename API,Rename无需Copy / Delete数据,直接在Metastore完成;List、Head操作,直接查询Metadate Store,避免对象存储QPS问题;性能:10万 QPS; Limitations:支持10亿级别Objects数量;Enable元数据后,不支持部分COS功能特性(详见产品帮助文档);需要创建新Bucket,不支持存量 Bucket;新Bucket Enable元数据加速后,不支持Disable。

icon组合Cache、元数据、数据,多种加速能力,满足大数据各种业务场景需求icon

COS Acceleration:Cache Accelerator + Data Accelerator + Metadata Accelerator * 在miss cache的情况下,后端存储提供 10 万QPS 的能力

icon混合云部署,云上、云下 同构,数据自由流动,业务灵活调度icon

借助 TStor 对象存储一体机数据自动上云能力,GooseFS在云上、云下提供统一的数据加速平台。IOT数据(车载数据、摄像头数据)上传 到本地数据中心TStor对象存储;本地大数据集群通过GooseFS加速数据 访问,完成数据清洗和标注,生成训练 数据集;TStor自动同步训练数据集到云上COS对 象存储;在云上按需拉起GPU训练集群,通过 GooseFS加速,完成AI模型训练。

icon客户案例:黑石GPU + GooseFS + COS AI训练icon

训练集群配置: 10 台黑石。黑石配置: 96c, 384g, Nvme-SSD-3.2TB * 4, V100-32GB * 8; 单个训练任务:单机8卡一次训练24小时,可以处理3亿张图片,每张图片 100KB,100 epochs,每个epoch处理300GB数据,数据总吞吐30TB。

icon客户案例:离线渲染业务方案icon
icon客户案例:实时搜索平台 TKE + GooseFS + COSicon
icon腾讯内部大数据案例icon

灯塔大数据平台: • 最大单集群超过120台 ,整体超过300台机器 • 长稳部署纯读case, 业务不中断 • 单节点读IOPS平均5K- 6K,峰值超过10K

产品推荐 查看更多>>
    腾讯云即时通信IM

    腾讯云即时通信IM,覆盖全平台、低门槛快速集成,可与TRTC、云直播、云点播、互动白板等产品协同使用。支持文字、表情、图片、短语音、短视频、文件、位置等多种消息类型,提升用户活跃度 。好友工作群、陌生人社交群、临时会议群、直播群、社群等多种群组类型,满足特定群聊场景,丰富社交手段。

    单聊、群聊、好友消息、陌生人打招呼

    弹幕、评论、点赞、送礼

    直播互动搭建指南

    大班课、小班课、名师课堂

    腾讯珠玑智能短消息服务

    腾讯珠玑智能短消息服务可直通微信小程序指定页面,引流线上, 促进销售转化。同时,可监测到个人点击,形成数据分析闭环,并基于腾讯系海量人群标签和推荐算法模型,提供多种人群 优选策略和机型标签,降本提效,精准分发内容到最匹配的会员手上

    直通微信小程序,会员精准触达

    独家智能短链接,无需任何额外开发

    提供多种人群优选策略,择优提效

    支持分机型发送,避免屏蔽,节省费用

    腾讯云智慧能源数字化转型平台

    腾讯智慧能源 EnerLink & EnerTwin,实现数字融合能源、连接助力低碳,以“数字融合能源,连接助力低碳”为使命,发挥腾讯科技、连接和生态优势,帮助企业提质增效、节能降碳和数字化转型。实现生产过程“实时监控、智能诊断、自动处置、智能优化”的油田业务新模式。

    实现数字融合能源、连接助力低碳

    帮助企业提质增效节能降碳

    实现生产过程“实时监控

    构筑坚实的云计算基础