
在当今数字化浪潮中,企业对于人工智能的应用需求愈发迫切,Agent 作为企业人工智能的关键一环,其落地与应用成为众多企业关注的焦点。12 月 18 日,火山引擎大模型服务平台火山方舟面向企业级 Agent 落地进行了全新升级,通过推理代工服务、强化学习平台和上下文管理工具,朝着让 Agent 真正创造业务价值的目标迈进,助力企业开启人工智能的下一阶段。
Agent 应用:驱动企业 AI 核心循环
Agent 应用是由更强模型驱动的核心循环,其中模型决定了 Agent 的能力上限,成本效益是 Agent 实现规模化的关键,而易落地则是模型能力转化为生产力的桥梁。火山方舟作为火山引擎大模型服务平台,始终从“更强模型、更低价格、更易落地”三大方向发力,加速 Agent 的创新与落地。
火山引擎智能算法负责人吴迪表示,随着大模型智能水平的持续提升,Agent 正逐步融入企业的核心业务。他预测,在未来三年之内,Agent 将为企业带来巨大的生产力提升。这一趋势也促使企业更加关注如何让 Agent 在业务中发挥更大的价值。
推理代工服务:开启低成本高吞吐推理新时代
构建好 Agent 之后,实现其大规模应用并创造业务价值的第一个关键点在于做好模型推理。在 2024 年之前,将核心业务构建在 AI 基础之上的企业相对较少,产业形态多为“IDM”集成器件制造,即自己训练、推理和迭代模型。然而,未来越来越多的企业将高度依赖 AI 能力,并基于自身业务和数据进行大量模型精调等后训练迭代。
对于大多数团队而言,低成本、高吞吐地推理一个大模型比后训练一个大模型更为困难。在建设初期,企业需要投入数百万人民币以上的成本,经历 3 - 6 个月左右的上线周期,还需面对复杂的运维工作。当业务与流量进入规模化扩张阶段,除了不断上涨的硬件成本,还有许多容易被忽视的隐形成本。

一方面,业务规模化对运维提出了更高要求,需要专业的 SRE 团队(站点可用性工程师)和 AI 架构师,而这些专业人才需要长期培养。另一方面,随着模型的不断迭代升级,企业需要考虑模型更换、实验、升级等成本,这些成本极难预先计划和控制,新业务的增长曲线也难以提前规划。新业务超预期增长时,企业的推理资源往往难以应对。
着眼于长远,AI 产业的推理和训练分工很可能会成为趋势。为此,火山方舟推出了推理代工服务,针对典型的开源大模型结构,采用“你训练,我推理”的模式。该服务提供经过大规模检验的系统支持、极致的弹性伸缩、全栈推理优化能力以及分布式缓存等全套支持,就像一辆准备就绪的顶级赛车,用户只需将模型插入“发动机”,即可开启推理之旅。
用户上传加密后的模型 Checkpoint 后,无需运维底层 GPU 资源,也无需进行复杂的网络和调度配置,只需关注业务流量本身。在一个开源模型的真实部署场景案例中,企业选择云上集群替代自建,硬件及运维成本可下降一半以上;而使用火山方舟的推理代工服务后,与在云上租赁 GPU 算力相比,客户可获得 1.6 倍的更大吞吐,并通过弹性经营和采购模式,避免了空闲时段 GPU 空置带来的浪费。推理代工作为一种 AI 产业的新模式,火山方舟仍在不断探索和改进产品。

强化学习平台:助力 Agent 在“实践”中进化
做好模型部署与推理后,Agent 自我学习与进化的能力成为关键。目前,许多 Agent 能够完成简单的自动化工作,但真正能够融入企业核心业务的 Agent 并不多。大部分 AI 系统是静态的,难以随着用户数据的增长自发地进化和提升。
强化学习的重要性日益凸显,其算力消耗也在快速攀升。模型训练正从单纯的深度学习作业向综合的分布式系统演化,将推理、训练、环境模拟等要素综合起来。然而,搭建一个大规模强化学习系统并非易事,用户需要考虑底层资源、算法框架、环境、工程构件等诸多复杂问题。例如,硬件环境和算法流程要稳定,资源池、拓扑和调度要高效运转,这些问题都拖慢了企业交付新 AI 产品的速度。
基于 veRL 开源框架,火山方舟为用户提供了高效易用的强化学习平台。其目标是让企业和开发者将精力集中在业务逻辑上,减少对工程细节的关注。就像一座冰山,用户只需关注与业务紧密关联的 reward 奖励函数、数据以及业务逻辑的设计,而复杂的工程系统则由火山方舟负责。

在火山方舟的强化学习平台上,开启训练变得轻松简单。用户无需关注资源配置,只需专注于奖励机制的设计与模拟环境的构建;同一套业务逻辑还能在不同算法间快速切换,方便用户尝试不同算法 pipeline,快速摸索业务收益。平台还保留了足够的灵活度,允许用户以代码插件的形式插入 rollout、reward 逻辑。此外,方舟提供训练轨迹的可视化以及一系列工具,帮助用户快速定位问题;训练好的模型还可立即托管到推理代工服务中,实现高效生产。
值得一提的是,强化学习的落地需要反复调试和试错,火山方舟平台只对运行成功的 Checkpoint 收费,对过程中的系统错误免单,展现了对市场客户的真诚与负责。在合适的场景下,开发者只需专注 rollout、reward 和数据闭环,就有很大概率取得正向回报。虽然强化学习方法仍存在许多不确定性,需要大量尝试,但火山方舟的探索能够帮助大家降低上手门槛,让持续积累的数据发挥更大的业务价值。

Viking AI 搜索新升级:重塑企业生产力
帮助 Agent 在业务中真正发挥价值的第三个重要方向是做好上下文理解,以及与企业核心业务的整合。在未来 AI 发展的蓝图中,有两项工作至关重要。
一方面,为模型和 Agent 提供优质输入。LLM 极大地增强了信息处理能力,因此对召回和排序提出了新的要求。另一方面,为人和最终用户提供优质输入。在未来很长一段时间内,“搜索 + 推荐”仍将是人机交互的主要入口,“对话”形式在很多场景下也是“搜索 + 推荐”的延续。搜索和推荐的入口汇聚了丰富的数据和商业机会,是许多开发者进行 AI 转型的第一站。
基于这些判断,火山方舟打造了 VikingDB 向量数据库、Viking 记忆库、Viking 知识库以及 Viking AI 搜索。在这个 AI 搜索平台上,搜索、推荐、问答功能一应俱全。平台将专业的搜索、推荐技术产品化,提供开箱即用的能力。企业只需一次数据导入,即可同时获得搜索、推荐、问答三种能力,仅需 4 步就能搭建好一套完整的“搜推问”系统,实现高效的用户引导和转化。

自发布半年以来,电商零售、新闻、传媒、硬件等众多行业的客户基于火山 Viking AI 搜索快速构建并落地了搜、推、问的能力,实现了业务的真实增长。如今,火山 Viking AI 搜索产品进行了升级,使 AI 能力与客户的核心经营数据真正结合起来。对外,为 C 端用户提供搜、推、问一体化的能力;对内,将企业核心经营数据与 C 端业务数据融合,助力企业提效。
在不同行业中,Viking AI 搜索展现出了强大的应用价值。在服饰零售行业,升级后的 AI 搜索能够将企业自有的商品库与全网公域穿搭趋势相结合,生成更符合企业特点和用户需求的推荐方向,提升组织效率。在线下零售行业,以某零食品牌线下门店运营为例,AI 搜索可以“激活历史资产”,将历史经验与经营数据匹配,结合门店库存与销售节奏,参考搜索和问答统计,生成千店千面的营销策略方案,放大个性化体验。在内容行业,Viking AI 搜索能够帮助企业做好图片、视频等多模态素材的理解、检索与个性化,不仅能理解视频中的关键场景、人物与事件,还能根据关键情节生成创意。

在 FORCE 原动力大会上,火山方舟推出了推理代工服务,让企业的自研模型能够在完善的推理环境中按实际业务需求弹性采购;更易用的强化学习产品则让开发者能够享受 AI 时代的数据飞轮,使 Agent 与数据共同进化;借助 Viking 产品,AI 助手、搜索推荐与业务核心经营数据实现了深度融合。过去一年,火山方舟为众多行业的客户提供了高质量的豆包模型服务,许多企业和创业团队在火山引擎的基础上构建核心 AI 系统,加速了 AI 转型的步伐。
在 AI 发展的漫长征程中,火山方舟希望通过不断创新的产品,为企业创造长期价值。如果您的企业也在寻求数字化转型和 AI 应用的解决方案,引导咨询云巴巴数字化服务平台,查看精准匹配方案,让专业的选型专家为您的企业发展保驾护航。


抖音算法推流核心指标是互动率而非GMV。天志互联直播抽盒系统从订单秒级上屏、一键拆盒、氛围引爆三个维度拉高互动率,驱动算法推流的正循环。

从"换皮联名"到"游戏化体验共创"——拆解彩棠敦煌联名案例的壁画修复小游戏设计逻辑、奶茶品牌联名翻车教训和中小品牌三条低成本高ROI的IP联名路径。

低代码时代品牌游戏化运营体系的"乐高式"搭建指南——从选模板、搭积分闭环、数据迭代到多活动并行管理和团队交接的全流程实操方法。

一个快消品牌用游戏化方法三个月救活240个死群的完整复盘——从签到排行榜、互动任务、习惯养成到赛季制防疲劳的六周运营节奏拆解。

游戏化社交裂变的三个底线原则深度拆解——让转发不像广告、让奖品有炫耀价值、给用户不转发的自由,加3%超级用户识别策略和三个常见翻车点避坑指南。