立即咨询

电话咨询

微信咨询

立即试用
商务合作

加速大模型应用落地,这份火山方舟大模型使用攻略请查收!

2025-01-17

大模型时代,一个小团队甚至个人,即可完成Agent应用开发。大模型时代,产品、运营、市场人员无需懂代码编写,即可开发AI应用。适应时代的发展,通过合适的AI平台与工具,积极拥抱大模型,将开发者从繁杂的琐事、代码编写中解放出来,更加聚焦在创新创造、释放生产力、提升效率上,或许就是大模型时代,开发者的求生之路。

火山引擎拥有许多优秀的模型和云产品,其中火山方舟一站式大模型服务平台提供模型精调、推理、评测等全方位功能与服务,全方位保障企业级AI应用落地。平台拥有海量资源,能够通过资源潮汐调度保障流量高峰时业务的稳定性。

为了确保用户能够充分利用火山方舟提供的强大功能,云巴巴为大家提供这份详细攻略,快来查收吧!

火山引擎火山方舟大模型服务平台

火山引擎火山方舟大模型服务平台提供模型精调、推理、评测等全方位功能与服务,提供丰富的插件生态和AI原生应用开发服务,并通过安全可信的基础设施,专业的算法技术服务,全方位保障企业级AI应用落地。

API调用

调用方式

1、请求结构

通信协议。支持通过HTTP或HTTPS两种方式进行请求通信,推荐使用安全性更高的HTTPS 方式发送请求。

请求方法。火山方舟API仅支持POST请求方法。

字符编码。请求及返回结果使用 UTF-8 的字符集进行编码。

2、地域和访问域名

地域(Region)指物理数据中心所在地理区域,资源创建后不支持更换地域。不同地域之间内网完全隔离。从地理位置的角度来讲,通常建议就近选择靠近您或者您的目标用户的地域,以减少网络时延,提高访问速度。

3、签名鉴权方式

API Key签名鉴权。API Key是请求火山方舟模型推理API的安全凭证,可以在API Key管理页面创建并获取API Key作为推理接入点的访问密钥。进入管理页面后,在有权限的项目下点击创建API Key,即可生成长效API Key。

AK/SK签名鉴权。访问密钥(Access Key)是请求火山引擎各云服务OpenAPI的安全凭证,可以参考Access Key管理获取账户的Access Key ID和Secret Access Key。

调用模型

API接口支持情况

大语言模型ChatCompletions API支持字段

豆包大语言模型Function Calling能力说明

管理API Key

用户可以通过API Explorer在线发起调用,无需关注签名生成过程,快速获取调用结果。

常见问题

Q:模型推理请求报错或者中断会计费么?

A:请求报错和中断分为下面几种情况。

客户端中断

无论是客户端因为无需后续结果主动中断请求,或超时中断请求,服务端感知到请求被中断,并终止服务端模型生成过程。在客户端中断,到服务端中止生成,中间仍旧有可能有若干个 token被生成出来。这些生成的token以及输入给模型处理的token会被计费。服务端中止生成后,就不会有进一步计费产生。

服务端中断

在流式输出过程中,如果输出一部分内容后,因为命中审核或其它原因,服务端中止了生成过程,已经生成的token仍旧会被计费。RPM/TPM等超限报错的请求不会开始模型生成过程,所以也不会产生任何计费。

Q:ArkAPIConnectionError (域名连接超时),怎么处理?

A:检查本地环境是否可以访问方舟公网域名,如果域名访问不通,可以考虑使用以下方式关闭 HTTP_PROXY。如果ping命令执行成功,但是调用时依旧有如下报错,可以尝试对 /etc/resolv.conf 文件做如下修改后再次请求。

Q:Windows系统安装SDK失败?

A:由于 Windows 系统有最长路径限制,可能会导致安装失败,请按照以下方式设置:

按下 Win+R ,输入 regedit 打开注册表编辑器。

设置 \HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem 路径下的变量 LongPathsEnabled 为1。

Q:使用视觉理解模型时,报错InvalidParameter?

A:

下载图片超时:为防止不必要的带宽浪费,默认图片下载超时时间5s。可能是图片访问速度较慢如外国网站,或者图片较大。对以上情况均建议更换到TOS上或压缩图片至100kB以下。

链接禁止访问:状态码403,部分图片服务器可能存在特殊安全/acl策略,禁止了火山源访问,建议检查客户所用图片服务器(阿里云对象存储/腾讯云对象存储/...)的安全策略。

Q:在任务状态为:运行中,终止中,已终止,失败的情况时,是否会有部分成功的结果输出?

A:会,已经运行成功的结果会写到output中,且运行成功的数据会正常计费。但是不保证任务运行顺序。

Q:基于什么的准则,去判断“失败”这种状态,是成功与错误比例,还是发现错误即判断失败?

以下情况判断任务失败:

文件输入格式不符合要求,如某一条数据不是json,会在任务开始前检测该类型错误,有错误会判定失败;预期外的错误,如job崩溃;任务运行超时;如果存在某条request运行失败,比如安全审核失败。这条request结果会写到error文件夹中,不会导致整体任务失败。

Q:在子任务数量巨大,无法预估处理所需的时间的前提下,设置的最大等待时间是否有大小上限?

A:CompletionWindow的最大等待时间最大可设置为28天。如果不指定,默认为28天。

Q:若由于超时使得批量推理任务状态为“已终止”,在终止之前所做的任务处理结果是否还有保留?

A:会保留,结果写在output中。

Q:输出长度是4k还是6k,亦或是其他?

A:限制与在线推理相同,输出超过限制会截断。

Q:批量推理按 tokens 用量计费,是按照输入tokens,或是输出tokens,又或是两者之和?

A:与在线推理相同,计费按照模型处理的内容量,输入输出都需要计费。

Q:对于处理失败的结果,也就是errors.jsonl中的结果,如何计费?

A:处理失败的结果不计费。

大模型时代已经来临,它为开发者们带来了前所未有的机遇与挑战。借助像火山方舟这样的先进平台,即使是没有深厚编程背景的产品经理、运营专员或市场人员也能轻松参与到AI应用的开发中来。

无论您是在寻找解决方案以应对特定的技术难题,还是希望深入了解如何高效地管理API调用,我们都提供了宝贵的指导信息。如果您遇到任何疑问,或者需要进一步的帮助和支持,请随时联系云巴巴的专业团队。我们将竭诚为您服务,确保每一位用户都能充分利用火山方舟的强大能力,加速实现自身业务目标。

云巴巴(Yun88.com)是中国领先的企业数字化服务平台,为客户提供数字化咨询、产品选型和采购的一站式服务,平台合作2000+厂商,上线20000+产品和方案,100+的数字化咨询顾问,致力于实现客户数字化转型的降本增效。

热门数字化产品

华云天下云呼叫中心系统HCC华云天下云呼叫中心系统采用HCCASR/TTS集成,客户可自定义VIP客户转接流程。拥有预测式外呼和预览式外呼两种,提供单声道、双声道、主被叫分离等多种录音方式以及不安装任何插件的情况下, 坐席录音可在线收听和下载 支持MP3,WAV格式等,使企业实现人工智能快速规模化落地。
北森盘点与发展系统北森盘点与发展系统,基于人才九宫格、人才名单结果,选拔高潜后备人才进入人才库,给予锻炼机会,加速成才。根据能力模型制定关键人才培养框架,根据盘点结果制定针对性的发展计划。评估角度多维度立体,适应企业现状,契合业务需要。
易仓ERP易仓ERP是3万+跨境卖家的增量选择,多平台多订单处理,多海外仓比价,易仓ERP系统6小时数据更新,财务核算又快又准,能够提高运营决策的准确度。
青椒云AIGC云桌面平台青椒云AIGC云桌面平台是一种基于云计算技术的虚拟桌面服务。通过在云端提供可扩展的桌面环境,允许用户通过网络从任意地点访问专属桌面界面。青椒云AIGC平台支持高性能计算和图形处理,适合设计、视频编辑等专业应用场景。此外,它还具备数据安全、远程协作、灵活定制等特点,能够满足不同行业和企业的个性化需求。通过青椒云AIGC,企业可以实现IT资源的集中管理和成本优化,同时提升员工的工作效率和协作灵活性。
酷学院企业培训SaaS平台酷学院多个基于AI技术的培训工具,有效降低培训运营传播,显著提升学习效果。基于对14大热点行业标杆企业的大数据分析,深入研究和实验,建立77个重点岗位职能的测评标准。依托AI技术, 精准提取视频、音频、语音等课件中的知识点, 转换成碎片化的知识内容,并对各个内容设置相应标签,形成系统化的知识图谱。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
主流知识管理系统性价比对比:Confluence、SharePoint 与腾讯乐享谁更胜一筹?​

在企业知识管理系统选型中,性价比是核心决策因素。本文对比 Confluence、SharePoint 与腾讯乐享三大主流方案,解析 Confluence 的高定制成本、SharePoint 的本地化局限,以及腾讯乐享 "即开即用 SaaS+3 天快速部署 + 自动维护" 的性价比优势,结合某制造业成本节省 3 亿元案例,为企业提供选型参考。

2025-06-13
企业合同审查工具怎么选?腾讯电子签合同智能审查功能上新

合同审查作为企业运营的“法律防火墙”,正经历从人工校验到智能协同的范式革新。企业合同审查工具怎么选,已成为众多企业管理者亟待解决的难题。

2025-06-13
游戏厂商如何破解玩家体验困局?网宿全站加速以技术重构加速新范式!

网宿科技推出全站加速解决方案,通过架构级技术创新重构加速体系,为游戏企业打造覆盖“首屏渲染-资源加载-实时交互”全场景的技术底座。

2025-06-13
企业客服机器人怎么选购?腾讯企点大模型客服机器人助力复杂问题解决

企业客服机器人怎么选购?腾讯企点大模型客服机器人助力复杂问题解决

2025-06-13
查看更多