立即咨询

电话咨询

微信咨询

立即试用
商务合作

豆包1.5大模型正式发布,一文读懂这款全新的多模态基础模型

2025-01-23

前有川普拉OpenAI、软银等公司成立AI公司,后有DeepSeek R1为代表的国产推理模型赶超OpenAI是所有AI公司的课题。2025年开年这场浪潮就已经愈演愈热,昨天字节跳动旗下的豆包大模型1.5 正式亮相,不仅全面升级了模型的核心能力,也融合并进一步提升了多模态能力,在多项公开评测基准中也是全球领先水平。

这次发布的豆包大模型1.5系列产品线包括:

Doubao-1.5-pro:多项基准测试综合得分优于GPT-4o、Claude 3.5 Sonnet等业界一流模型,创历史最佳成绩。

Doubao-1.5-lite:用轻量级成本实现旗舰级性能,综合性能持平或超越GPT-4omini,Cluade 3.5 Haiku。

Doubao-1.5-vision-pro:定位专业视觉理解模型,在保持强大性能的同时,回复更简洁友好,多模态能力超越了GPT-4o-0806。

Doubao-1.5-realtime-voice-pro:真正实现端到端语音对话,具备低时延、对话中可随时打断、自然的情绪表达等特性,即将开放API服务。最重要的是豆包大模型将继续保持原有模型价格不变,加量不加价。

豆包通用模型 Pro

Doubao-1.5-pro 现已逐步在豆包APP中推出,鉴于对话系统首先进行的是意图识别,因此用户可能难以确切知晓自己是否正在使用1.5 Pro版本。不过,开发者可以通过火山引擎直接调用该API来确保使用此版本。

Doubao-1.5-pro 在多项权威评估基准上取得了卓越的成绩,包括知识领域(MMLU_PRO、GPQA)、编程能力(McEval、FullStackBench)、推理技巧(DROP)以及中文处理(CMMLU、C-Eval),其综合表现超越了诸如GPT-4o和Claude 3.5 Sonnet等业界顶尖模型。

火山引擎豆包大模型

火山引擎豆包大模型是字节跳动推出的自研大模型。通过字节跳动内部50+业务场景实践验 证,每日千亿级tokens大使用量持续打磨,提供多模态能力,以优质模 型效果为企业打造丰富的业务体验。

豆包通用模型 Lite

作为轻量级语言模型的一员,Doubao-1.5-lite 同样达到了全球领先的水平。客户可以在多种应用场景中以更低的成本享受到几乎与Pro版本相匹配的性能。

该模型在综合能力(MMLU_pro)、推理能力(BBH)、数学技能(MATH)及专业知识(GPQA)等多个权威测评指标上,均与GPT-4omini和Claude 3.5 Haiku持平甚至更胜一筹。

豆包视觉理解模型

相比上一版本,Doubao-1.5-vision-pro在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。

支持任意分辨率和极端长宽比图像识别。豆包视觉理解模型采用原生动态分辨率的架构设计,支持任意分辨率的图像输入。

领先的复杂指令遵循能力。豆包视觉理解模型通过系统性的原子能力拆解和多维度指令的逻辑组合,在后训练阶段引入多样化的视觉指令数据,从而激发模型的指令遵循能力,从容应对需要遵循更复杂指令的场景。

豆包实时语音模型

全新的豆包实时语音模型,并已在豆包APP中全面开放使用(在开始体验之前,请确保您的豆包APP已更新至7.2.0版本)。

这款模型集成了语音理解与生成的功能,提供了一体化的端到端语音对话解决方案。相较于传统的级联式处理方法,豆包实时语音模型在语音的自然度、情感传递以及响应速度上展现出色,同时支持低延迟和即时中断对话等功能,为用户提供更加流畅自然的交互体验。

豆包发布的系列模型表现显著,不仅继承了上述各版本的优势,更进一步融合创新,形成了独特的特色和优势。

更强的模型架构。模型结构上,豆包大模型1.5采用大规模稀疏MoE架构,以较小的激活参数进行预训练,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。

更低的成本。字节跳动自研服务器集群方案灵活支持低成本芯片,硬件成本比行业方案大幅降低;自研网卡和网络协议,显著优化小包通讯效率;算子层计算和通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。

总结而言,豆包大模型1.5系列的发布标志着AI技术的一个重要里程碑。通过在通用语言处理、视觉理解以及实时语音交互等领域的全面升级,豆包不仅为用户提供了更加智能和高效的服务,同时也为开发者们开辟了新的应用可能性。

如果您希望了解更多关于豆包大模型1.5的信息,或是探讨如何将这一强大工具融入您的业务流程中,欢迎随时联系云巴巴。我们的团队将竭诚为您提供专业的咨询和支持,帮助您开启智能新时代的大门。

云巴巴(Yun88.com)是中国领先的企业数字化服务平台,为客户提供数字化咨询、产品选型和采购的一站式服务,平台合作2000+厂商,上线20000+产品和方案,100+的数字化咨询顾问,致力于实现客户数字化转型的降本增效。

热门数字化产品

分贝通企业支出管理平台分贝通企业支出管理方案,全面满足企业费用支出管理需求。一站式企业支出管理平台,体验全新企业支出体验,全流程费控,全场景支付,提供整合的数据及流转。为高成长企业带来一站式的企业支付体验,帮助财务更高效、更数字化的管理费用支出。
优易WMS智能仓储管理系统优易WMS智能仓储管理系统系统是服务专业物流云仓客户的大型自动化智能仓库管理软件。支持B2C、B2B业务,深耕于鞋服、快消品行业,积累仓储行业多年实践经验。通过对出入库、库位精细化管理,实现对仓库的先入先出、效期等全方位管理,全面支持云仓客户的电商业务,满足电商客户的各种复杂仓库内场景作业需求。
飞画flyDrop飞屏显示控制系统是一款专业的多媒体展览展示控 制管理软件,系统采用先进的软件技术,创新性地将内容、智能设备(声光电)融为一体,为展厅、智慧运营中心、智慧楼宇等展览展示场景提供灵活、简单、 易用的控制解决方案,大大提高对创意内容、屏幕、空间、设备的调度能力,赋能屏幕,赋能智 慧生活。
腾讯Tapd研发项目管理平台TAPD是源自于腾讯的敏捷产品研发协作平台,提供贯穿敏捷开发生命周期的一站式服务。覆盖从产品概念形成、产品规划、需求分析、项目规划和跟踪、质量测试到构建发布、用户反馈跟踪的产品研发全过程,提供了灵活的可定制化应用和强大的集成能力,帮助研发团队有效地管理需求、资源、进度和质量,规范和改进产品研发过程,提高研发效率和产品质量。
腾讯云实时音视频TRTCTRTC 源自 QQ 音视频团队,是基于 QQ 20多年来的音视频技术积累,在腾讯云上部署售卖的 RTC 云服务。TRTC 支撑了腾讯会议、微信群直播、微信视频号直播、企业微信直播、腾讯课堂、全民K歌等业务是腾讯集团丰富的音视频场景的最佳实践输出。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
跨境企业突围战!优刻得云主机破解合规、延迟、成本三大难题

面对跨境行业的出海需求呈现爆发式增长问题,如何构建一张高效、安全、智能的全球网络,成为企业出海成功的关键。

2025-04-29
出行服务平台如何利用私域做好运营?四大步骤助公私域流量衔接与转化

优秀的私域营销平台句子以“下一代营销云”为核心,为出行服务平台构建了从引流、沉淀到持续激活的闭环运营体系,直击行业痛点。

2025-04-29
电商大促如何破局?深度分析TAPD如何成为GMV增长的核心引擎?

如何选型一款工具,既能在流量洪流中稳抓机遇,同时避免资源内耗与系统崩溃?

2025-04-28
几十家店铺开票如打仗?小望电商通让财务告别手忙脚乱

在电商行业高速发展的今天,多平台、多店铺运营已成为企业常态,如何选择一款既能提升效率又能保障合规的智能开票工具是企业当前最为头疼的难题。

2025-04-28
查看更多