立即咨询

电话咨询

微信咨询

立即试用
商务合作

群“模”乱舞下如何让AI大模型与行业深度结合成为可能

2024-03-27

世界人工智能大会上,可以说大模型占据当仁不让的C位,国内外总计30余款大模型集体亮相,据不完全统计,其中既有来自企业巨头华为、百度、阿里、京东等推出的通用大模型,也有来自清华、复旦等学院派大模型,还有包括出门问问、第四范式等创业公司入局,“厮杀”尤为激烈。

腾讯论坛上腾讯公布了一系列AI创新进展。在业界普遍关注的AI大模型领域,腾讯云公布了技术底座、创新场景、AI for Science三大领域升级,也是继6月行业大模型技术解决方案后的再次更新。

其中,腾讯自研星脉高性能计算网络、向量数据库的最新升级,将为大模型的行业应用提供更强大的底层能力;金融风控、交互翻译、数智人等创新场景,为行业大模型行业探索提供更多可能性;AI for Science,持续将AI大模型等最新技术应用在天文探索、文化考古领域,以科技助力可持续社会价值创新。

腾讯论坛现场,腾讯集团副总裁、政企业务总裁李强表示:大模型时代,数据、网络、算力构成了底层基础设施的“铁三角”,除了提供MaaS服务,腾讯云也在通过云服务的方式,为行业大模型的打造提供HCC高性能计算集群、向量数据库等基础设施服务。

据了解,星脉网络具备 3.2Tbps 业界最高互联带宽,能提升 40% 的 GPU 利用率,节省 30%~60% 的模型训练成本,还让 AI 大模型通信性能提升 10 倍。同时,基于腾讯云新一代算力集群 HCC,星脉网络可支持 10 万卡的超大计算规模。

星脉网络是为大模型而生。它所提供的大带宽、高利用率以及零丢包的高性能网络服务,将助力算力瓶颈的突破,进一步释放 AI 潜能,全面提升企业大模型的训练效率,在云上加速大模型技术的迭代升级和落地应用。

iconAI 大模型 3 大网络需求:大带宽、高利用率、无损网络

目前,AI 大模型的训练参数已飙升至万亿级别,如此庞大的训练任务无法由单个服务器完成,而需要大量 GPU 服务器组成算力集群,相互协作完成任务。

这些服务器通过机间网络相连接,不断交换数据。因此,高性能网络具有至关重要的地位,它有利于让算力集群更加快速、准确地完成大规模的训练任务。

大集群不等于大算力,相反,GPU 集群规模的扩大还会引发额外的通信开销。因为传统网络架构下,数据传输时会通过多层协议栈,需要反复停下来检查、分拣、打包,导致通信效率低下。

也就是说,网络层级越多,致 GPU 集群通信性能将越低。现在爆火的生成式 AI 大模型需要运用千亿、万亿参数规模进行训练,这个训练过程中通信占比最大可达 50%,而传统低速网络的带宽无法支撑。

在这个问题的解决上,业界通常会引入 RDMA 技术(GPU 之间直接通信),这是一种高性能、低延迟的网络通信技术,能够允许计算节点之间直接进行数据传输,减少中间环节。

但光靠 RDMA 技术还远远不够,传统网络协议也将制约 GPU 集群的运行效率。传统网络协议也很容易导致网络拥塞、高延时和丢包,而仅 0.1% 的网络丢包就可能导致 50% 的算力损失,最终造成算力资源的严重浪费。

3.2Tbps 带宽,支持 10 万卡集群组网

基于以上问题,腾讯云在交换机、通信协议、通信库以及运营系统等软硬件方面进行升级,推出了自研的大模型专属高性能网络 " 星脉 "。

" 带宽 " 决定了能够同时传输的数据," 拓扑 " 是节点设备间的连接方式,决定了组网规模的大小。在这两项硬指标上,腾讯云称星脉皆达到了业界最高水平。

在硬件方面,星脉网络自研白盒交换机,这是一种软硬件解耦的开放网络设备,采用四层解耦体系,包括接入、转发、路由、管控系统;腾讯云还自研了网络操作系统,包括网络 OS 与网管平台,构建了互联底座,实现自动化部署和配置。

在软件方面,腾讯云自研的 TiTa 网络协议,能够实时监测并调整网络拥塞,TiTa 网络协议能够提升 40% 的带宽负载,还能提供低延时无损网络,实现高负载下的 0 丢包,使集群通信效率达 90% 以上。

此外,腾讯云还为星脉网络设计了高性能集合通信库 TCCL,融入定制化解决方案,使系统实现了微秒级感知网络质量。结合动态调度机制合理分配通信通道,可以避免因网络问题导致的训练中断等问题,让通信时延降低 40%。

icon全方位,多角度解决行业侧需求

为了解行业需求,腾讯在10个行业中选择了一些现有客户,提供了50多个解决方案,去尝试用大模型技术解决特定行业问题。很多客户觉得大模型很贵,其实贵的不是大模型本身,而是它的推理算力。所以腾讯的方式是针对客户的问题,以最低的成本、最合适的模型和服务,来让客户真正用上大模型。

在腾讯云TI平台内置的行业大模型基础上,企业只要加入自己独有的场景数据,就能快速生成自己的专属模型,同时还能够按需定制不同规格、不同参数的模型服务。

在算力层面,腾讯发布了专门为大模型训练设计的新一代HCC高性能计算集群,采用腾讯云星星海自研服务器,算力性能提升了3倍;腾讯云将推出向量数据库(Tencent Cloud VectorDB),源自腾讯的向量引擎(OLAMA),更适用于AI运算和检索。

在平台层面,腾讯TI平台能提供完善的大数据工具链,包括数据标注、训练、评估、测试和部署等全套工具;“太极Angel”在传统CV、NLP算法模型的基础上,新增了对大模型的训练和推理加速能力,相比行业常用方案性能提升30%以上。

云巴巴作为腾讯云的铂金合作伙伴,致力以助力企业数字化转型,不断完善数字化服务平台的产品。未来,云巴巴将继续为企业用户提供更好的数字化服务,助力企业数字化转型。并将持续关注和探索人工智能技术的应用,目前腾讯云的许多产品都已经在云巴巴平台上线,如果您有需要可以通过平台购买,享受更多优惠!

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

热门数字化产品

壹悟科技智能物流仿真系统Simulator壹悟科技智能物流仿真系统(Simulator)可以实现对仓储场景和工厂场景的业务流程仿真。支持用户导入项目现场运行地图,自定义移动机器人的参数和数量,以真实的物流业务调度系统(WCS)和机器人调度系统(RCS)为内核,驱动仿真运行,高度还原业务实际场景的作业流程和节拍。支持2D和3D实时运行显示,并提供完善的运行数据统计分析。
酷学院企业培训SaaS平台酷学院多个基于AI技术的培训工具,有效降低培训运营传播,显著提升学习效果。基于对14大热点行业标杆企业的大数据分析,深入研究和实验,建立77个重点岗位职能的测评标准。依托AI技术, 精准提取视频、音频、语音等课件中的知识点, 转换成碎片化的知识内容,并对各个内容设置相应标签,形成系统化的知识图谱。
腾讯云服务器CVM腾讯云云服务器致力于提供安全稳定、高弹性的计算服务,为视频、游戏、金融、互联网等行业知名企业及个人开发者提供稳定的计算服务。支持基于快照创建云盘,支持快照跨地域复制。 一键开启云盘加密,满足安全和认证的需求;基于overlay技术构建逻辑隔离网络空间VPC; 安全组、网络ACL。
百度智能云客悦智能客服系统百度智能云客悦智能客服系统作为百度智能对话平台的一次重大升级,基于大模型完成企业级对话平台重构,提供高效搭建任务对话、知识问答、人设闲聊等AI原生Agent的能力,帮助企业高效开启大模型智能对话全新体验,为智能对话系统的发展树立了新的里程碑。
腾讯云即时通信IM腾讯云即时通信IM,覆盖全平台、低门槛快速集成,可与TRTC、云直播、云点播、互动白板等产品协同使用。支持文字、表情、图片、短语音、短视频、文件、位置等多种消息类型,提升用户活跃度 。好友工作群、陌生人社交群、临时会议群、直播群、社群等多种群组类型,满足特定群聊场景,丰富社交手段。
为你推荐
直播间在线人数卡在500上不去?天志互联抽盒系统从互动率破局

抖音算法推流核心指标是互动率而非GMV。天志互联直播抽盒系统从订单秒级上屏、一键拆盒、氛围引爆三个维度拉高互动率,驱动算法推流的正循环。

2026-06-26
品牌联名越做越亏?天志互联用游戏化体验共创重新定义IP营销

从"换皮联名"到"游戏化体验共创"——拆解彩棠敦煌联名案例的壁画修复小游戏设计逻辑、奶茶品牌联名翻车教训和中小品牌三条低成本高ROI的IP联名路径。

2026-06-26
一个人也能搭游戏化运营体系?低代码时代品牌运营的乐高式搭建指南

低代码时代品牌游戏化运营体系的"乐高式"搭建指南——从选模板、搭积分闭环、数据迭代到多活动并行管理和团队交接的全流程实操方法。

2026-06-26
私域社群打开率跌破3%以后:一个快消品牌的游戏化自救实验

一个快消品牌用游戏化方法三个月救活240个死群的完整复盘——从签到排行榜、互动任务、习惯养成到赛季制防疲劳的六周运营节奏拆解。

2026-06-26
品牌私域裂变怎么设计才不被骂?游戏化社交裂变的三个底线原则

游戏化社交裂变的三个底线原则深度拆解——让转发不像广告、让奖品有炫耀价值、给用户不转发的自由,加3%超级用户识别策略和三个常见翻车点避坑指南。

2026-06-26
查看更多