立即咨询

电话咨询

微信咨询

立即试用
商务合作

豆包1.5大模型正式发布,一文读懂这款全新的多模态基础模型

2025-01-23

前有川普拉OpenAI、软银等公司成立AI公司,后有DeepSeek R1为代表的国产推理模型赶超OpenAI是所有AI公司的课题。2025年开年这场浪潮就已经愈演愈热,昨天字节跳动旗下的豆包大模型1.5 正式亮相,不仅全面升级了模型的核心能力,也融合并进一步提升了多模态能力,在多项公开评测基准中也是全球领先水平。

这次发布的豆包大模型1.5系列产品线包括:

Doubao-1.5-pro:多项基准测试综合得分优于GPT-4o、Claude 3.5 Sonnet等业界一流模型,创历史最佳成绩。

Doubao-1.5-lite:用轻量级成本实现旗舰级性能,综合性能持平或超越GPT-4omini,Cluade 3.5 Haiku。

Doubao-1.5-vision-pro:定位专业视觉理解模型,在保持强大性能的同时,回复更简洁友好,多模态能力超越了GPT-4o-0806。

Doubao-1.5-realtime-voice-pro:真正实现端到端语音对话,具备低时延、对话中可随时打断、自然的情绪表达等特性,即将开放API服务。最重要的是豆包大模型将继续保持原有模型价格不变,加量不加价。

豆包通用模型 Pro

Doubao-1.5-pro 现已逐步在豆包APP中推出,鉴于对话系统首先进行的是意图识别,因此用户可能难以确切知晓自己是否正在使用1.5 Pro版本。不过,开发者可以通过火山引擎直接调用该API来确保使用此版本。

Doubao-1.5-pro 在多项权威评估基准上取得了卓越的成绩,包括知识领域(MMLU_PRO、GPQA)、编程能力(McEval、FullStackBench)、推理技巧(DROP)以及中文处理(CMMLU、C-Eval),其综合表现超越了诸如GPT-4o和Claude 3.5 Sonnet等业界顶尖模型。

火山引擎豆包大模型

火山引擎豆包大模型是字节跳动推出的自研大模型。通过字节跳动内部50+业务场景实践验 证,每日千亿级tokens大使用量持续打磨,提供多模态能力,以优质模 型效果为企业打造丰富的业务体验。

豆包通用模型 Lite

作为轻量级语言模型的一员,Doubao-1.5-lite 同样达到了全球领先的水平。客户可以在多种应用场景中以更低的成本享受到几乎与Pro版本相匹配的性能。

该模型在综合能力(MMLU_pro)、推理能力(BBH)、数学技能(MATH)及专业知识(GPQA)等多个权威测评指标上,均与GPT-4omini和Claude 3.5 Haiku持平甚至更胜一筹。

豆包视觉理解模型

相比上一版本,Doubao-1.5-vision-pro在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。

支持任意分辨率和极端长宽比图像识别。豆包视觉理解模型采用原生动态分辨率的架构设计,支持任意分辨率的图像输入。

领先的复杂指令遵循能力。豆包视觉理解模型通过系统性的原子能力拆解和多维度指令的逻辑组合,在后训练阶段引入多样化的视觉指令数据,从而激发模型的指令遵循能力,从容应对需要遵循更复杂指令的场景。

豆包实时语音模型

全新的豆包实时语音模型,并已在豆包APP中全面开放使用(在开始体验之前,请确保您的豆包APP已更新至7.2.0版本)。

这款模型集成了语音理解与生成的功能,提供了一体化的端到端语音对话解决方案。相较于传统的级联式处理方法,豆包实时语音模型在语音的自然度、情感传递以及响应速度上展现出色,同时支持低延迟和即时中断对话等功能,为用户提供更加流畅自然的交互体验。

豆包发布的系列模型表现显著,不仅继承了上述各版本的优势,更进一步融合创新,形成了独特的特色和优势。

更强的模型架构。模型结构上,豆包大模型1.5采用大规模稀疏MoE架构,以较小的激活参数进行预训练,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。

更低的成本。字节跳动自研服务器集群方案灵活支持低成本芯片,硬件成本比行业方案大幅降低;自研网卡和网络协议,显著优化小包通讯效率;算子层计算和通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。

总结而言,豆包大模型1.5系列的发布标志着AI技术的一个重要里程碑。通过在通用语言处理、视觉理解以及实时语音交互等领域的全面升级,豆包不仅为用户提供了更加智能和高效的服务,同时也为开发者们开辟了新的应用可能性。

如果您希望了解更多关于豆包大模型1.5的信息,或是探讨如何将这一强大工具融入您的业务流程中,欢迎随时联系云巴巴。我们的团队将竭诚为您提供专业的咨询和支持,帮助您开启智能新时代的大门。

云巴巴(Yun88.com)是中国领先的企业数字化服务平台,为客户提供数字化咨询、产品选型和采购的一站式服务,平台合作2000+厂商,上线20000+产品和方案,100+的数字化咨询顾问,致力于实现客户数字化转型的降本增效。

热门数字化产品

橙色云CRDE智橙协同设计研发平台橙色云CRDE智橙协同设计研发平台是SaaS云原生平台,整合云CAD、项目管理、BOM管理等多功能,支持多终端、跨地域协同工作。它以云PLM与云CAD一体化为核心,提供一站式产品创新解决方案,推动企业数字化转型,实现高效、低成本研发设计。
腾讯云即时通信IM腾讯云即时通信IM,覆盖全平台、低门槛快速集成,可与TRTC、云直播、云点播、互动白板等产品协同使用。支持文字、表情、图片、短语音、短视频、文件、位置等多种消息类型,提升用户活跃度 。好友工作群、陌生人社交群、临时会议群、直播群、社群等多种群组类型,满足特定群聊场景,丰富社交手段。
跨境云手机跨境云手机,基于自主知识产权的磐玉蜂巢服务器及创新的容器化技术, 跨境云产品以“ 高安全性、高能效比、高性价比” 为价值理念, 持续构建丰富的ARM云产品矩阵, 帮助客户以更低成本获得安全稳定、绿色节能、高效敏捷的ARM云服务和云算力,为跨境直播带货,海外市场营销和进出口贸易,跨境电商出海创造更多可能。
百度智能云客悦智能客服系统百度智能云客悦智能客服系统作为百度智能对话平台的一次重大升级,基于大模型完成企业级对话平台重构,提供高效搭建任务对话、知识问答、人设闲聊等AI原生Agent的能力,帮助企业高效开启大模型智能对话全新体验,为智能对话系统的发展树立了新的里程碑。
探域电商全域智能客服机器人探域电商全域智能客服机器人,以消费者触点为核心,助力品牌全域数智化运营,实现高质量增长。我们通过AI人工智能、NLP技术和行业知识图谱的核心技术,构建了营销服务一体化智能客服机器人、全域客户数据中台 Lite CDP、私域一体化智能营销SCRM等核心产品。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
主流知识管理系统性价比对比:Confluence、SharePoint 与腾讯乐享谁更胜一筹?​

在企业知识管理系统选型中,性价比是核心决策因素。本文对比 Confluence、SharePoint 与腾讯乐享三大主流方案,解析 Confluence 的高定制成本、SharePoint 的本地化局限,以及腾讯乐享 "即开即用 SaaS+3 天快速部署 + 自动维护" 的性价比优势,结合某制造业成本节省 3 亿元案例,为企业提供选型参考。

2025-06-13
企业合同审查工具怎么选?腾讯电子签合同智能审查功能上新

合同审查作为企业运营的“法律防火墙”,正经历从人工校验到智能协同的范式革新。企业合同审查工具怎么选,已成为众多企业管理者亟待解决的难题。

2025-06-13
游戏厂商如何破解玩家体验困局?网宿全站加速以技术重构加速新范式!

网宿科技推出全站加速解决方案,通过架构级技术创新重构加速体系,为游戏企业打造覆盖“首屏渲染-资源加载-实时交互”全场景的技术底座。

2025-06-13
企业客服机器人怎么选购?腾讯企点大模型客服机器人助力复杂问题解决

企业客服机器人怎么选购?腾讯企点大模型客服机器人助力复杂问题解决

2025-06-13
查看更多