icon产品概述:应用场景icon

讯云语音合成产品满足将文本转化成拟人化语音的需求,打通人机交互闭环。通过提供多场景、多情感、多语言、多音色的选择,对合成业务实现更全面的支撑能力。同时,腾讯云语音合成支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。

智能客服
在智能客服场景中,语音合成可结合腾讯云语音识别(ASR)、自然语言处理(NLP)等产品,打通人机交互闭环,实现高质量的外呼音色,打造更自然、更拟人的客服外呼场景。
有声阅读
腾讯云语音合成可实现将小说、电子教材、新闻报纸等阅读材料进行有声播报,声音自然富有情感,为有需要的用户提供沉浸式阅读体验。
短视频配音
腾讯云语音合成可广泛应用于各种泛娱乐场景,尤其是短视频配音场景,可以极大提升创作者的音频创作效率,并帮助实现精彩的音视频视听盛宴。
智能播报
腾讯云语音合成可在智能导航、新闻资讯等场景提供语音播报功能,终端用户可根据需要自主选择多种播报型发音人。
icon产品概述:语音合成(TTS)技术与应用架构icon
icon产品功能:产品矩阵icon

腾讯云语音合成支持70余个音色,其中包含精品音色40余个,支持包括中文普通话、粤语、英文在内的多个中文方言与语种,对主流的语音合成业务场景有很好的适配性。此外,产品也支持SSML标记语言,客户可根据需要进行参数配置,实现更自然的TTS音色。腾讯云语音合成(TTS)目前有四个产品类型:基础语音合成、实时语音合成、长文本语音合成、离线语音合成。基础语音合成适用于较短文本(150字以内),且无实时性要求的场景;实时语音合成支持中长文本(600字以内),且对实时性要求高的场景;长文本语音合成适合较长文本(10万字以内),适用于有声阅读、新闻媒体等场景;离线语音合成支持在无网络的情况下进行语音合成。

icon产品功能:语音合成在线版icon

腾讯云语音合成(TTS)在线版目前有三个产品类型:标准语音合成、实时语音合成、长文本语音合成。标准语音合成适用于较短文本(150字以内),且无实时性要求的场景;实时语音合成支持中长文本(600字以内),且对实时性要求高的场景;长文本语音合成适合较长文本(10万字以内),适用于有声阅读、新闻媒体等场景。

标准语音合成
标准语音合成适用于较短的文本,合成完毕后下发音频,每次请求最多150个汉字,支持输出wav、MP3格式。典型的应用场景有:移动APP语音播报新闻、智能设备语音提醒、车载导航语音播报等。
长文本语音合成
长文本语音合成适用于较长文本,能够对10万字符以内的文本进行合成,并异步返回音频结果,支持输出MP3、wav、pcm格式,能够满足一次性合成较长文本的客户需求,适用于阅读播报、新闻媒体等场景。
实时语音合成
实时语音合成适用于实时要求高的场景,边合成边下发音频,每次请求最多600个汉字,支持输出pcm、opus、MP3格式。典型的应用场景有:智能机器人交互、有声小说阅读、智能学习硬件等。
icon产品功能:语音合成在线版icon

腾讯云语音合成(TTS)在线版目前有三个产品类型:标准语音合成、实时语音合成、长文本语音合成。标准语音合成适用于较短文本(150字以内),且无实时性要求的场景;实时语音合成支持中长文本(600字以内),且对实时性要求高的场景;长文本语音合成适合较长文本(10万字左右),适用于有声阅读、新闻媒体等场景。

icon产品功能:语音合成在线版音色介绍icon

腾讯云语音合成(TTS)支持不同场景下的多种音色,对主流的方言和语种也有所覆盖(蓝色代表特色音色)。

icon产品功能:语音合成在线版参数配置icon
语速
0.6倍~1.5倍
音量
0-10,可调节11档音量
采样率
8kHz、16kHz
输出格式
Wav、MP3、opus、pcm等多种格式
icon产品功能:离线语音合成icon

腾讯云语音合成(TTS)离线版目前有一个产品类型:离线语音合成,主要的接入方式为客户端(Android、iOS)SDK。离线语音合成适用于无网络、弱网情况下的语音合成场景,与在线版相同,离线语音合成也支持基础音色、精品音色两种音色品质(但不支持长文本合成),建议客户根据使用场景及设备性能状况选择合适的音色进行使用。精品音色合成效果好,但资源消耗较大,如果设备性能比较差的情况下,建议只使用基础音色。

步骤一:购买离线SDK授权
(免费版需申请)
登录离线SDK控制台,购买离线SDK授权(离线语音合成SDK提供5个免费额度,有更多额度需求需要进入购买流程)
步骤二:
下载离线SDK
进入控制台离线SDK下载列表,下载离线SDK(含授权license)
步骤三:
激活离线SDK
将下载后的SDK进行一次联网激活,后续即可在无网络情况下使用该SDK
步骤四:
查看用量
用户可在控制台查看、分配SDK激活设备数或已绑定的应用
icon产品功能:语音合成在线版、离线版功能对比icon
icon产品功能:SSML标签icon

腾讯云语音合成(TTS)支持SSML标记语言,SSML是基于 XML 的语音合成标记语言;可以更加准确、具体的定义合成音频的效果。腾讯云语音合成服务的 SSML 实现,基于 W3C 的语音合成标记语言版本1.1。目前只有中文合成支持 SSML 功能。

icon产品功能:SSML标签icon

腾讯云语音合成(TTS)支持SSML标记语言,SSML是基于 XML 的语音合成标记语言;可以更加准确、具体的定义合成音频的效果。腾讯云语音合成服务的 SSML 实现,基于 W3C 的语音合成标记语言版本1.1。目前只有中文合成支持 SSML 功能。

icon产品功能:SSML标签icon

腾讯云语音合成(TTS)支持SSML标记语言,SSML是基于 XML 的语音合成标记语言;可以更加准确、具体的定义合成音频的效果。腾讯云语音合成服务的 SSML 实现,基于 W3C 的语音合成标记语言版本1.1。目前只有中文合成支持 SSML 功能。

icon产品优势icon

腾讯云语音合成(TTS)在合成技术、适用场景、音色自然度和个性化音色上都有明显优势,可为不同行业、不同需求的客户提供高质量的服务。同时,腾讯云还能支持客户的商用级音色定制需求(详情请参照产品-声音工坊)。TTS是AI最早的应用场景之一,距今已有数余年,目前语音产品已经形成几家巨头,如何突破巨头垄断、实现客户成功成为许多伙伴的售前难题。本章也会对行业趋势进行介绍。腾讯云语音合成(TTS)在技术、功能和听感体验上都有明显优势,在市场上处于业界领先地位。

技术先进

采样端到端神经网络和对抗神经网络技术,合成的语音具有自然度高、情感表现力强,音质清晰度高的特点。同时在多音字处理上兼顾规则和神经网络技术相结合,极大程度提高了多音字发音的准确度。

音色真实、听感自然、风格多元

合成音色接近真人,拟真度高,读音准确,韵律自然,音色饱满富有表现力,MOS评分业内领先,支持童声、情感声等多元音色风格,具有极高的声音表现力。

多语种、多方言

除中文普通话和英语外,还支持包括粤语、东北话等在内的多种方言和多个语种,多个音色模型均支持中英文混合合成。

适用多领域、多场景

可广泛适用于智能客服、短视频配音、智能家居、有声阅读、银行、保险、证券、物流、运营商、法庭、房地产、教育等多个行业。

支持动态调参配置

支持SSML标记语言灵活调整语言风格,在音量、音高、语速上也支持个性化配置。

支持定制声音、活用声音

除常规TTS产品外,为满足用户个性化需求,腾讯云还支持声音复刻、声音定制、声音变换、歌声合成等音色活用产品,详情可参见附录【声音工坊】系列产品。

icon产品趋势icon

语音合成业界整体的大趋势有以下几点:情感化趋势、定制化趋势、多语种+多方言趋势。

情感化趋势

市场背景:由于元宇宙、数智人等行业的需求,客户需求由通用TTS向情感化、个性化TTS转变,需要产品能够尽量贴近真人的发音。腾讯云TTS:我们会在2022年底上线数个情感化tts音色,并且支持客户通过ssml标记语言配置情感化标签(如愤怒、开心、紧张等),帮助客户实现“声音情感化”这一行业需求。

定制化趋势

市场背景:客户希望通过几句话来定制自己或自己公司的专属IP声音,来提升品牌形象和售卖转化率,同时降低相关的人力效率。腾讯云TTS:我们的声音工坊产品目前支持声音复刻、声音定制、歌声合成等多元音色玩法。由于声音定制属于独立产品线,相关材料请见本材料结尾处【附录】。

多语种、多方言趋势

市场背景:随着短视频配音、企业出海等市场趋势的兴起,目前企业对多语种、多方言的应用需求也逐渐加大。腾讯云TTS:目前我们已经支持四川话、东北话、粤语等主流方言,也支持日语、韩语等小语种,预计在2022年底即将支持印尼语、菲律宾语等多个东南亚小语种。

icon产品路线图icon

腾讯云语音合成(TTS)致力于在支持通用音色的基础上,为客户提供情感化、定制化、多方言语种的行业技术解决方案。

2022.10
上线TTS离线嵌入式版本(金融播报16k、金融播报8k、通用基础版、通用精品版、通用高清版)共5个离线版产品,上线情感女声音色。
2022.11
上线日语、印尼语、菲律宾语等东亚、东南亚小语种,上线情感男声音色。
2022.12
支持并发扩容计费,高清版(22k)有声书场景女声音色。
2023.1
定制音色支持情感化、拟人化、虚拟化音色定制,上线台湾普通话、广西老表普通话等短视频专有音色。
icon标杆案例icon

腾讯云语音合成(TTS)在智能客服、短视频配音、智能家居、有声阅读、银行、保险、证券、物流、运营商、法庭、房地产、教育等多个行业有落地经验,积累了丰富的行业词库和标杆案例。

中信银行:智能客服机器人
项目背景客服处理大量枯燥工作,强度大,弹性不足;客服离职率高、业务培训成本高;人工效率低,服务质量不足。 客户需求:保障客服的服务稳定,同时高效服务,抓住营销机会,提升客服销售转化率。解决方案: 腾讯云TTS提供了多个客服音色供客户使用,音色风格亲切、专业,富有表现力,结合腾讯云语音识别(ASR)搭起了一套“从听懂到输出”完整的客服链路。除公有云外,还支持了客户的私有化部署服务。客户价值:减少人工客服成本,提升服务质量及服务效率,提升了客户的营销转化率。
阅文集团(QQ阅读):有声阅读
项目背景: 阅文作为行业第一的内容版权方,通过声优录音制作有声书的成本高昂,因此希望采用TTS能力来合成有声书。解决方案: 低成本的解决方案:书籍存量大(1300+W)、内容更新多。丰富的音色选择:语种上覆盖普通话&方言、风格上富有变化(深沉、甜美、亲切等)。 客户价值:帮助客户降低有声书朗读的真人声优录制成本,极大提高了生产效率;通过高质量的音色输出,帮助客户提高PV、UV,为客户提供增值付费服务的产品空间。
富途牛牛:资讯播报
项目背景:早间和通勤的路上,获取新闻信息已经成为很多用户的习惯;移动互联网兴起后,用户的获取新闻的方式从电视转移到新闻类App,富途牛牛希望为客户提供有声新闻播报。
解决方案:腾讯云提供专业新闻播报类音色,发音专业、自然。满足用户随时获取新闻播报的需求。
客户价值:实现新闻资讯自动播报,降低新闻播报成本,提高内容生产效率。
易车网:短视频配音
项目背景:Vlog等短视频制作场景中,视频创作者需要先拍摄视频画面、准备解说文稿、后期配解说词;而由人来完成后期配音,难免会因为读错、卡壳等原因反复录制,增加了视频制作的时间成本;
解决方案:通过腾讯云语音合成,将解说文本快速合成音频,提供多种契合不同场景的音色选择;
客户价值:大大缩短Vlog内容的制作周期,实现批量生产视频并快速分发的可能,帮助视频创作者获得更多流量。
icon标杆客户合集icon
产品推荐 查看更多>>
    信服-智能对话系统

    基于中科凡语领先的语义理解技术,为各个细分领域提供智能对话系统,实现多轮交互对话,节省大量人力成本和时间成本,提升服务质量。

    高可用

    性价比高

    建筑智能化工程

    涵盖用户电话交换系统、有线电视及卫星电视接收系统、公共广播系统、火灾自动报警系统、安全技术防范系统、建筑设备监控系统、信息网络系统

    高可用

    高效稳定

    追一科技 YiButler智能酒店管家

    YiButler智能酒店管家,从交互到服务,通过AI准确且个性化的感知,让便利服务触手可及。提升的不仅有客人的入住体验,更有酒店的服务效率。

    优质的体验

    功能强大且不断进化的数字管家