简单高效!快节奏时代,腾讯小样本数智人打造有温度“数智员工”

来源: 云巴巴 2024-03-27 10:31:15

品牌代言、公司宣传、产品介绍、直播带货......数智人扮演的角色正在不断增加。无论是替代真人服务、多模态AI助手、还是作为虚拟世界的第二分身,对于数智人而言都已经是触手可及的未来。

数智人作为企业的数字资产,是对员工工作的增强,可以进一步释放生产力,同时降本增效。未来数智人将根据不同行业的业务特点和应用场景进行更深度结合,孵化千行千面的数字员工,提供智能化服务。

icon低成本实现高精度,是数智人产业化真谛

数智人的第一道技术门槛,就是生产制作。

制作数智人的流程,可以分为建模、驱动和渲染三个阶段,缺一不可。

建模,即搭出数智人的「基础骨架模型」,驱动则让模型「动起来像人」,渲染则负责让模型「看起来像人」。

从建模到驱动到渲染,再注入AI,让数智人真正的成为用户或行业可用的智能产品,每一个阶段都面临操作复杂、算法门槛高、开发周期长的问题,成本更是超大型企业才负担得起。而类似于银行、政务服务、直播间、景点导览等需求方,往往不具备独立开发制作人的技术能力,能承受的制作成本更是相当有限。

因此,数智人产业化发展的真谛,正是如何降低成本,实现简单高效。

对于腾讯来说,数智人不再是单一个体,他们还可以有不同职业身份和技能,并且可提供定制化角色服务。它们的背后,集成了多模态建模、语音识别、自然语言处理、知识图谱、视觉技术等综合AI能力。

2021年的腾讯数字生态大会上,腾讯首次公布了云智能的战略架构,整体面向管理者、生产者、开发者、用户四大人群,提供决策、协作、创新和服务四大核心能力。腾讯云智能通过AI与云的深度融合,大大降低AI开发和使用门槛,让客户实现高效开发、按需使用,从而满足客户在新型应用场景下,综合复杂、多层次的计算需求。

针对于低成本的开发,腾讯云小微推出的小样数智人产品,就适用于内容讲解、口播视频生产、直播带货等真人出镜场景,节约成本,全年无休。

icon小样本数智人

腾讯云小微小样本数智人即通过少量的小样本素材(3~5分钟),即可导入训练模型,生成与真人无异的数字人分身,五官、动作、表情完全模仿真人。

使用方式:仅需通过输入文本或音频,即可快速生成数智人分身视频,大幅节省每次拍摄的时间、空间、用人成本。

与精品形象相比,小样本数智人拍摄时间与训练时间都非常短,拍摄环境要求低,也只需要采光良好的安静环境即可,可支持文本驱动与声音驱动,提供50~100句声音素材就可以进行声音的复刻。

拍摄物料:

绿幕。(视频换背景效果顺序依次为绿幕、蓝幕、纯色幕、其它,且幕布的颜色和衣服桌子要有差异)。

拍摄设备。提词器、三脚架、摄像机或手机(拍摄)或pad(题词)。

其他设备。灯光器械、收音耳麦、场景道具、单位机、返送屏、泡沫板、监视器等。

拍摄环境:

环境

需要寻找一个安静尽量没有噪声和混响的录制环境。

光线尽量充足,灯光均匀,脸部无阴影。

根据景别调整相机和人之间位置。

摄像机

摄像头要固定,无抖动。

帧率:25帧率或50帧率。

分辨率:1080P到4K,分辨率越高越好。

压缩码率crf=6;参考ffmpeg里面的参数。

录制过程:

方式一:一镜到底

拍摄整体相关

整个过程一录到底,相机不中断;不出现视频拼接的情况;

拍摄后的视频不做额外的压缩转码;

开始和结尾处人物进出摄像头的数据不保留,需要裁剪掉。

模特发型和服装

发型尽量简单,不要太多毛边或缝隙不利于抠图;脸部要全部露出;

服装颜色要和幕布颜色有差异和区分度;

不建议佩戴长款耳坠。脖子不要有遮挡。

模特动作相关

模特头要正对镜头,不要俯视或仰视;

动作自然,可加上自然的点头、微笑,眨眼,动作尽量可复用;

动作不要出框,不要挡住脸部;

不要有大幅的转头动作。

模特口型相关

朗读的文本可自行选择,可以朗读一段与实际业务场景相关的文本;

说话吐字清晰,嘴巴张开,口型不宜过小;

说话过程中不要吐舌头;

语速适中,不要过快或过慢。

方式二:分段拍摄

每段视频时长:每段在1分钟以上,几段视频加起来要5分钟或以上即可;(单段视频不能出现剪辑拼接的情况);

拍摄环境:每段视频的相机位置、曝光参数、背景、灯光、模特服饰、发型等要保持稳定;

模特位置:每段视频模特头部位置相对固定(参考点:所有视频人脸鼻尖位置不能超出第一段视频首帧头部区域);

拍摄结束:提交多段无压缩转码等处理的高清原视频。

云巴巴作为腾讯云小微的重要合作伙伴,也一直在和腾讯携手共同为企业用户提供更多优质的产品与服务,如果您对小样本数智人的使用更感兴趣,可以扫描下方二维码联系我们!

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

RPA如何自动读取手机验证码?

RPA如何自动读取手机验证码?

RPA机器人能够模拟人工操作计算机的习惯,去调用电脑中的程序、系统(包括Excel/Word等、浏览器页面、OA系统、企业管理系统等)。从这些程序中将所要录入的数据自动转移到系统层上,实现跨平台、跨系统的数据迁移,操作简单,安全稳定。

2022-02-23 10:19:59

用户行为分析和机器学习的区别有哪些

用户行为分析和机器学习的区别有哪些

想要进行数字化转型,怎么能不知道用户行为分析和机器学习呢?快来和小编一起了解一下。 很多人会自然而然的认为机器学习是用户行为分析中最核心的技术,因为用户行为分析在一定程度上属于数据驱动的安全分析类产品,而厂商从市场营销宣传上也是很愿意迎合这样的想象。不可

2022-11-21 11:08:28

智能机器人视觉组成是如何组成的

智能机器人视觉组成是如何组成的

机器人进行视觉是其智能化最重要的标志产品之一, 对机器人智能及成本控制都具有一个非常十分重要的意义,目前国内外正在寻求研究,已经有一些系统使用。 一般由摄像机、图像采集卡和计算机技术组成,视觉信息系统是自主机器人的重要因素组成一个部分,机器人视觉系统的工

2022-11-22 09:47:34

人工智能赋能场景化的普及正在加速

人工智能赋能场景化的普及正在加速

在移动通过互联网、大数据、人工进行智能等技术可以加速经济发展的今天,很多的想法不再是天方夜谭。 回顾过去,人工智能领域的许多进展或许还未被大众认可,今年 3 月 4 日,我国明确指出要加快推进包括5G 网络、人工智能、数据中心等新型基础设施建设进度。但在

2022-11-22 15:31:46

人脸识别领域又一次革新——腾讯云人脸核身

人脸识别领域又一次革新——腾讯云人脸核身

腾讯云人脸进行识别技术服务在多个国家国际社会公开教学竞赛中刷新世界纪录,人脸数据比对在2017年的 LFW 测评中准确度高达99.80%;人脸信息搜索在 MegaFace 竞赛百万企业规模中首选识别率达83.29%,排名中国第一,识别系统准确率业界领先。

2022-11-23 15:55:53

疫情中大放异彩的智能机器人你了解多少

疫情中大放异彩的智能机器人你了解多少

随着技术的发展,服务机器人将快速上升,每个领域机器人使用正在快速推进。机器人的潜在市场需求是暂时的,或者这将是一个未来发展的新的趋势?机器人的普遍应用可以大大提高工作效率。防止人与人之间的直接接触,大大降低了感染相关人员的风险。

2020-04-22 18:00:17

严选云产品

BarTender企业标签制作软件 使用BarTender可以轻松地创建、自动打印和管理条形码、标签、RFID标记等。BarTender是一款简单且可扩展的解决方案, 它有四个版本,适用于各种规模的企业。
左手医生智能导诊系统 左手医生智能导诊系统解决患者盲目就诊问题,减轻分诊工作压力。降低患者挂错号比例,优化患者就诊流程,有效提高线上线下医疗机构接诊效率。
埃文科技IP定位数据电商平台应用方案 埃文科技IP定位数据电商平台应用方案,通过IP的地理位置信息与GPS信息交叉验证,识别判断用户本次操作行为的风险程度,以保证用户账号及交易安全。IP定位不需要用户授权,只需要对用户IP地址进行解析,就可以得到用户的地理位置信息。同时可以根据用户的位置分布,为线下门店的选址提供数据支撑。
中科闻歌红旗融媒体智能操作系统 中科闻歌红旗融媒体智能操作系统,坚持先进技术引领驱动融合发展 , 强化媒体与受众连接,深化全媒体传播体系构建“融媒体 + 行业” 未来发展新业态。面向国家媒体融合重大战略部署 , 打造服务媒体 “策、 采、 编、 发、 管、 馈、 评” 全链条业务生态的智能媒体操作系统。
ITC讯笛数字会议系统 讯笛会议系统是一款基于双ARM处理器平台开发的系统,具备超强的处理能力。支持16组相控分区扩声、同声传译、相控输出、角色分离模式多种音频输出模式,实现一机多用;支持环形双链路备份功能、数模备份功能,保证系统运行的稳定性。
合思易快报标准版 易快报作为行业内唯一一家打通企业消费与费控全链路的厂商,自主经营模式提升使用体验感。企业消费与企业费控数据打通,避免平台间反复切换,减少数据出错的概率。系统之间的兼容性远高于行业内其他平台,并能保持同步升级、迭代的更新速度,获得更好的使用体验。

甄选10000+数字化产品 为您免费使用

申请试用