简单高效!快节奏时代,腾讯小样本数智人打造有温度“数智员工”

来源: 云巴巴 2024-03-27 10:31:15

品牌代言、公司宣传、产品介绍、直播带货......数智人扮演的角色正在不断增加。无论是替代真人服务、多模态AI助手、还是作为虚拟世界的第二分身,对于数智人而言都已经是触手可及的未来。

数智人作为企业的数字资产,是对员工工作的增强,可以进一步释放生产力,同时降本增效。未来数智人将根据不同行业的业务特点和应用场景进行更深度结合,孵化千行千面的数字员工,提供智能化服务。

icon低成本实现高精度,是数智人产业化真谛

数智人的第一道技术门槛,就是生产制作。

制作数智人的流程,可以分为建模、驱动和渲染三个阶段,缺一不可。

建模,即搭出数智人的「基础骨架模型」,驱动则让模型「动起来像人」,渲染则负责让模型「看起来像人」。

从建模到驱动到渲染,再注入AI,让数智人真正的成为用户或行业可用的智能产品,每一个阶段都面临操作复杂、算法门槛高、开发周期长的问题,成本更是超大型企业才负担得起。而类似于银行、政务服务、直播间、景点导览等需求方,往往不具备独立开发制作人的技术能力,能承受的制作成本更是相当有限。

因此,数智人产业化发展的真谛,正是如何降低成本,实现简单高效。

对于腾讯来说,数智人不再是单一个体,他们还可以有不同职业身份和技能,并且可提供定制化角色服务。它们的背后,集成了多模态建模、语音识别、自然语言处理、知识图谱、视觉技术等综合AI能力。

2021年的腾讯数字生态大会上,腾讯首次公布了云智能的战略架构,整体面向管理者、生产者、开发者、用户四大人群,提供决策、协作、创新和服务四大核心能力。腾讯云智能通过AI与云的深度融合,大大降低AI开发和使用门槛,让客户实现高效开发、按需使用,从而满足客户在新型应用场景下,综合复杂、多层次的计算需求。

针对于低成本的开发,腾讯云小微推出的小样数智人产品,就适用于内容讲解、口播视频生产、直播带货等真人出镜场景,节约成本,全年无休。

icon小样本数智人

腾讯云小微小样本数智人即通过少量的小样本素材(3~5分钟),即可导入训练模型,生成与真人无异的数字人分身,五官、动作、表情完全模仿真人。

使用方式:仅需通过输入文本或音频,即可快速生成数智人分身视频,大幅节省每次拍摄的时间、空间、用人成本。

与精品形象相比,小样本数智人拍摄时间与训练时间都非常短,拍摄环境要求低,也只需要采光良好的安静环境即可,可支持文本驱动与声音驱动,提供50~100句声音素材就可以进行声音的复刻。

拍摄物料:

绿幕。(视频换背景效果顺序依次为绿幕、蓝幕、纯色幕、其它,且幕布的颜色和衣服桌子要有差异)。

拍摄设备。提词器、三脚架、摄像机或手机(拍摄)或pad(题词)。

其他设备。灯光器械、收音耳麦、场景道具、单位机、返送屏、泡沫板、监视器等。

拍摄环境:

环境

需要寻找一个安静尽量没有噪声和混响的录制环境。

光线尽量充足,灯光均匀,脸部无阴影。

根据景别调整相机和人之间位置。

摄像机

摄像头要固定,无抖动。

帧率:25帧率或50帧率。

分辨率:1080P到4K,分辨率越高越好。

压缩码率crf=6;参考ffmpeg里面的参数。

录制过程:

方式一:一镜到底

拍摄整体相关

整个过程一录到底,相机不中断;不出现视频拼接的情况;

拍摄后的视频不做额外的压缩转码;

开始和结尾处人物进出摄像头的数据不保留,需要裁剪掉。

模特发型和服装

发型尽量简单,不要太多毛边或缝隙不利于抠图;脸部要全部露出;

服装颜色要和幕布颜色有差异和区分度;

不建议佩戴长款耳坠。脖子不要有遮挡。

模特动作相关

模特头要正对镜头,不要俯视或仰视;

动作自然,可加上自然的点头、微笑,眨眼,动作尽量可复用;

动作不要出框,不要挡住脸部;

不要有大幅的转头动作。

模特口型相关

朗读的文本可自行选择,可以朗读一段与实际业务场景相关的文本;

说话吐字清晰,嘴巴张开,口型不宜过小;

说话过程中不要吐舌头;

语速适中,不要过快或过慢。

方式二:分段拍摄

每段视频时长:每段在1分钟以上,几段视频加起来要5分钟或以上即可;(单段视频不能出现剪辑拼接的情况);

拍摄环境:每段视频的相机位置、曝光参数、背景、灯光、模特服饰、发型等要保持稳定;

模特位置:每段视频模特头部位置相对固定(参考点:所有视频人脸鼻尖位置不能超出第一段视频首帧头部区域);

拍摄结束:提交多段无压缩转码等处理的高清原视频。

云巴巴作为腾讯云小微的重要合作伙伴,也一直在和腾讯携手共同为企业用户提供更多优质的产品与服务,如果您对小样本数智人的使用更感兴趣,可以扫描下方二维码联系我们!

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

快来了解一下我们的办公新伙伴OCR吧(一)

快来了解一下我们的办公新伙伴OCR吧(一)

有句古话是怎么说来着,工欲善其事必先利其器。不得不感慨古人的智慧,这句话放到如今也同样适用。想要有效的提高我们的工作效率,就要选对辅助我们的办公工具。本文就要介绍一个非常好的办公工具,就是OCR软件。 工作流程 只是我们要把这些影像作一个企业转换,一个

2022-11-21 15:37:56

PaaS时代来临,未来的运维发展之路是怎样的?

PaaS时代来临,未来的运维发展之路是怎样的?

一个严重的误区是认为云计算将彻底取代运维行业,虽说伴随着PaaS时代的来临,对以后运维职业发展将产生深远的影响,实际上在IT发展的过程中,对运维的要求在不断提高。

2022-11-22 16:51:33

人脸识别与售货机的这些姻缘你知道吗?

人脸识别与售货机的这些姻缘你知道吗?

都说现今社会是“看脸”的时代,人脸识别技术不仅是上下班还是手机中的面部解锁,越来越多的领域都出现了人脸识别技术的身影。我们每个人的面部不仅成为了独属于我们自己的一个标志,也成为了方便我们日常办公的一大利器。科技的发展让我们亲自感受到了越来越多的变化,人脸识

2022-11-23 16:41:23

1分钟13亿人的生物识别,中国天网系统有多牛?

1分钟13亿人的生物识别,中国天网系统有多牛?

只要你在中国境内,一切都在掌控之中。耗资2000亿巨资打造的“天网系统”,可能要比电影场景中更为魔幻。

2022-11-23 09:50:45

统一身份认证子系统的主要三大功能

统一身份认证子系统的主要三大功能

之前的文章已经介绍过很多关于统一身份认证的知识了,本文,会继续介绍一下统一身份认证的子系统的主要三大功能。 统一身份认证子系统的主要三大功能分别是,身份认证模块、权限管理模块和安全审计模块,统一身份认证(CAS)包括了统一身份认证服务和IAM 单点登录

2022-11-21 13:56:56

“虹膜识别”想要快速准确的秘密是什么?

“虹膜识别”想要快速准确的秘密是什么?

“虹膜识别”按字面意思并不难以理解,当今越来越多的解锁方式出现在我们面前。而“虹膜识别”因为我们的虹膜不可复制以及更加便捷得以在众多的解锁方式中脱颖而出。能否快速的完成虹膜对比,正确的判断信息,对“虹膜识别”技术也是一项新的挑战。因为一旦识别发生错误则会给

2022-11-23 16:09:57

严选云产品

金山办公数字办公平台 WPS Office可帮助你快速实现软件正版化,规避因版权法律诉讼带来的经济损失。为政企客户提供了多种高级培训课程,培养员工高效使用办公软件,提高工作效率。将WPS Office统一升级至最新版本,提升办公效率,解决因浏览器版本、Office控件和版本差异造成的兼容性问题。
道一云生产制造行业仓储管理系统 道一云生产制造行业仓储管理系统,规范化仓库管理协同流程,集仓库管理、产品管理、供应商管理、出入库管理、盘点管理于一体,通过系统化、规范化落地仓库管理流程,全方位的控制和跟踪仓库业务,便捷进行仓库工作的管控。
梅卡曼德机器人重工业解决方案 梅卡曼德机器人重工业解决方案,轻松应对现场不同品规、结构复杂的曲轴工件;支持一定程度反光、表面锈色、结构复杂等情况;可快速适应新增品规;智能轨迹规划、碰撞检测算法,可引导机器人在形变深框环境中稳定抓取,避免发生碰撞,显著提升清框率。
网易瑶台 网易瑶台,通过AI算法加持,只需要一张照片即可生成个性化形象,并支持200+维度的自由捏脸,打造元宇宙专属虚拟角色。基于分布式服务框架,支持十万虚拟角色实时在线,通过AOI(感兴趣区域)机制,实现万人同屏下虚拟角色间可见、可交互。
小麦助教校务管理系统 小麦助教校务管理系统,覆盖招生营销、私域运营、教务管理、在线教学、课后督学、家校服务、财务分析、品牌传播、经营进阶9大场景。配备专业的招生工具、打卡工具、直播课堂等,贯穿教育机构运营管理全流程。
腾讯云工作负载安全防护 腾讯云工作负载安全防护,基于AI技术的新一代主机安全防护系统,基于腾讯漏洞响应体系,提供全面的漏洞风险管理,及时应对最新漏洞威胁。面向云原生容器场景提供的一站式安全解决方案,保障容器业务从镜像构建、部署到运行时全生命周期安全。

甄选10000+数字化产品 为您免费使用

申请试用