icon出门问问TTS技术优势 icon
端到端语音合成引擎
自主研发端到端语音合成引擎MeetHiFiVoice 合成语音准确、流畅、自然MOS值接近4.5
韵律流畅、发音准确
领先的韵律准确率,多音字准确率业界Top 1 语气/语调合成和重读/拖音功能拟人化TTS
情感合成&跨语种声音合成
覆盖喜/怒/哀/乐四个维度的情绪表达 情感强度控制,让合成语音更有温度感跨语种合成能力
歌唱合成
优化端到端歌唱合成系统, 输入乐谱(musicxml/ midinode),输出歌曲音频
实时声音转换&角色迁移
实时声音转换能力角色迁移,发音人可以模仿不同的年龄和性别,同时保留原本音色特点
声音克隆
20句声音克隆
100句声音克隆
500句声音克隆
高品质声音输出
48K超高清音质
iconTTS端到端语音合成引擎,合成效果媲美真人 icon
icon领先的韵律准确率,多音字准确率业界Top 1 icon
icon丰富的语气/语调合成和重读/拖音功能,增强声音的表现力 icon
 
语气合成技术
结合NLP及多模态识别,实现不同语气合成,丰富的 语气更能够增加音频的表现力
 
重读/拖音功能
用重音去强调部分、传递新信息、对比信息,或者是澄清信息
重读:音调加重
拖音:音长拉伸
重读 + 拖音:音调加重 + 音长拉伸
icon拟人化TTS,让声音更自然 icon
拟人化TTS
结合文案,生成更自然、轻松的语音,拟人化因素包含延音、 插入停顿、插入语气词、重读、快语速、情感等
应用场景
适合车载助手、语音聊天助手、闲聊机器人 Demo演示: 哎太强了,诶,你在哪儿了? 嗯,对,嘶,诶,所以你觉得,就是young老师他上课的有趣的点在哪儿呢?
icon情感语音合成 icon
 
情感语音合成
覆盖喜/怒/哀/乐四个维度的十几种情绪表达,让合成语音更有温度感
 
情感迁移语音合成
跨说话人情感迁移语音合成:在发音人无情感数据的情况下,使该发音人的模型能够合成情感音频,降低情感模型成本,无需录制情感数据 可以扩充线上发音人风格多样性,可扩展至离线,单个模型可合成多情感音色
icon情感强度控制icon
 
情感强度可控发音人在无情感数据的情况下,除了能够合成发音人的情感声音,还能做到情感强度的可控
icon跨语种语音合成 icon
 
跨语种语音合成
在发音人无其他语种(英文、日文等)数据的情况下,使该发 音人的模型能够合成该语种音频 降低发音人成本,不需要寻找会多种语言的发音人也能合成多种语言,并增加录制成本可以扩充线上发音人语言多样性
icon歌唱合成&歌唱合成迁移 icon
 
歌唱合成
优化端到端歌唱合成系统,输入乐谱(musicxml/midinode),输出歌曲音频
icon实时声音转换 icon
 
实时声音转换
声音转换使用Encoder-Decoder模型,并结合vocoder生成 对应音频,获得更好的解析力与表达能力,并更加适配实时语音转换,多种声音可选,无延迟实时转化
icon角色迁移 icon
 
角色迁移
发音人可以模仿不同的年龄和性别,同时保留原本的音色特点。 例如,青年男性发音人的声音可以通过降低音调和语速来模拟 老年发音人的语音,但发音人的身份不变。降低发音人录制成本,提高线上发音人多样性(扩充年龄段和性别)
Demo演示: 初始声音为青少年女,角色迁移模型可以得到该发音人另外9个角色
icon声音克隆 icon
 
声音克隆
最短只需录制20句话,在小时级别内即可获得声音模型,同时可以在不额外录制数据的情况下,让声音拥有丰富的情感以及多语言能力 3种声音克隆服务:20句试用版,100句个人定制版,500句企业定制版
icon高品质声音输出 icon
 
48K尊享音质
8 kHz: 电话的采样率
16 kHz: 大部分语音助手都使用这个采样率
22.05 kHz: 无线电广播的采样率
44.1 kHz:CD 的采样率
48 kHz: 专业音频的采样率
icon出门问问TTS承接平台-魔音工坊 | 专业的AI配音软件 icon
 
全能创新的音频合成编辑功能:停顿调节、重音、声音转换等
丰富的声音IP:央广满超、知名配音员杨婧、知名主播采采等
成熟的应用商店:1000+发音人,1200+声音风格
南腔北调,语种多样
情感合成,情绪多变
网页、小程序和APP,一个账户,多端通用
、100万+用户使用验证
短视频AI配音行业第一品牌
icon强大的音频合成编辑功能 icon

首创声音编辑器,可实现多音字、重度、停顿调节、连续等功能,支持局部变速、变音、多人配音,自带版权BGM、音效等。

icon1000+发音人满足用户多样性需求 icon

100+方言配音、外语配音,支持老人、小孩等不同年龄、不同音色的声音。

icon覆盖喜怒哀乐四大维度情绪,让声音更有温度 icon
icon众多大咖入驻魔音 icon
icon多元化的解决方案 icon
魔音工坊会员授权
API调用
成熟的声音克隆技术
私有化部署
SDK离在线混合方案,离线效果接近在线
离线SDK低资源消耗:CPU低,内存少
完整的声音商店整体方案(支付、浏览、下载等)
icon全新的后付费合作模式 icon
icon领先的声音定制服务 icon
声音专属
供应商提供声音,可选择有限 VS 自己的声音打造专属的品牌
短周期
传统录音需3-6个月录音周期 VS 魔音工坊仅需1周即可输出声音模型
低成本
传统定制方案代价高昂:50万 VS 魔音工坊方案成本大幅度降低
icon魔音工坊声音克隆八大优势 icon
高品质配音
量身定制声音模型
高度还原音色
企业级TTS定制服务
情绪饱满、真实自然
音质清晰、声音流畅
多种情绪合成能力
声音转化
支持声音转换功能
强化情绪表现
录制门槛低
20句、100句、500句
三种模式可选
小时级别,快速取得数据
服务专业
一站式专业团队全程跟进
提供7*24小时服务
交付快速
从需求确认到上线
最快3天可交付
使用方便
适配魔音全套配音工具
云端服务,随时随地,即用即享
安全可靠
定制声音部署到魔音工坊
根据客户需求,授权使用方独家使用
icon魔音工坊声音克隆八大应用场景 icon
语音助手
搭载手机、车载语音服务
帮助企业客户为其用户定制声音
宣传片配音
声音作为品牌资产可以被长期持有
让宣传物料配音更规划化、统一化
自媒体配音
短视频、公众号配音不仅可以更高效配音,还可以拥有独一无二的声音
IP/数字人配音
每个IP都可以有专属声音
IP价值不会因配音人员流失而受损
有声读物
有声书、有声电台、儿童书籍等有声读物配音,更省时、省力
声音分身
作为企业意见领袖、明星的声音分身 帮其承担企业文化宣传、祝福ID等录制
声音陪伴
亲子故事、父母聊天、恋人陪伴
让声音替代真人,增强亲人之间的互动
声音永存
逝去的人,声音可以得到永存
icon声音转换,音色转化成其他发音人 icon

说话人转换:保留「原说话人」的声调、韵律、停顿等特色,音色转换成「目标人」音色。

iconDupdub(魔音海外版):助力短视频出海 icon
iconOverview of DupDub icon
icon品牌合作案例 icon
icon品牌合作案例-微信读书 icon
 
微信读书、微信听书均已使用出门问问TTS技术服务
通过TTS合成技术和魔音工坊发音人在平台生产有声书作品
点击收听实际案例《墨桑》,此案例在微信听书已经上线。
icon愿景:定义下一代人机交互,让人和机器的交互更自然 icon
icon浓厚的技术基因 icon
一流团队
创始人李志飞博士毕业于美国约翰霍普金斯大学、曾任Google美国总部研究科学家 现有员工约400人,60%为研发人员, 其中50%拥有研究生或以上学历
核心AI专利数百项
申请900余件专利,其中发明超过680件,海外专利100余件,PCT国际申请20余件,获得各类授权专利430余件
前瞻性AI基础研究
构建通用语言智能算法平台(UCLAI) 开源端到端语音识别训练系统Wenet 近几年在国际顶级会议发表20+篇学术论文(如ACL,EMNLP,ICASSP等)
行业资质与奖项
“国家高新技术企业”资质 “中国独角兽企业”(2017年起连续五年) “吴文俊人工智能科技奖”(中国智能科学领域最高奖) 多项软硬件产品获得国家权威检测机构优秀等级
icon商业逻辑架构:以AI算法为切入点,赋能各行各业 icon
技术
全栈式AI语音
核心算法
软硬结合
产品实现
智能可穿戴设备
智能车载
元创岛
魔音工坊
商业化
全球化
多模态
AIOT + AI SaaS
创新与未来
Digital Avatar
Sounds like you
Looks like you
Acts like you
元宇宙基础建设
iconAI算法:基于神经网络的自主全栈式AI算法 icon
信号处理
声源定位、波束形成、回声消除
混响抑制、噪音抑制、盲源分离
语音唤醒
支持多语种热词
语音识别
普通话及带口语的普通话、粤语、英文,8K信道可达85%, 16K信道可达96%
语义理解
基于知识图谱13个维度、 130多个垂直领域
对话管理
支持单轮、多轮对话
语言生成
集成情感模型
语音合成
支持男声、女声、台湾女声、女童声 MOS值 4.5
icon核心技术能力:语音交互 icon

基于AI算法构建语音助手产品,通过终端设备触达用户。

icon商业落地:全球领先的AI可穿戴设备 icon

智能手表和真无线蓝牙耳机是高增长、高天花板的市场,将持续成为ToC增长引擎。

iconAI可穿戴:一流的国际产业合作伙伴 icon
 
出门问问 x 谷歌
2015年10月获得谷歌C轮融资
成为谷歌在中国的官方合作伙伴为Wear OS阵营合作品牌提供中文语音核心系统
出门问问 x 高通
高通全球战略合作伙伴
可穿戴芯片4100的全球首发
icon商业落地:智能车载(德国车规级前装语音助手) icon
icon商业落地:AI算法license落地 icon
产品推荐 查看更多>>
    腾讯云智聆口语评测SOE

    智聆口语评测(Smart Oral Evaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,支持单词、句子、段落、自由说等多种模式,支持发音准确度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中文及英语口语类教学中。

    全年龄段覆盖的中英文语音评测打分

    支持字词、句子、段落等多种语音评测模式

    支持发音准确度、流利度等全方位打分机制

    可广泛应用于中文及英语口语类教学中

    思必驰M4降噪会议麦克风音箱

    思必驰M4降噪会议麦克风音箱实时通话降噪,3 米拾音距离会议记录更省时。培训讲师声音更清晰,培训录音文稿整理更便捷。随声录音、语音实时转文字,出稿更便捷。

    语音转文字记录

    体积小巧

    超长续航

    智能降噪

    思必驰胸牌质检软硬件解决方案

    思必驰胸牌质检软硬件解决方案70*25mm标准胸牌外观,洛可可ID设计, 高端商务质感,彰显职业形象; 服务过程自然拾音,避免对录音笔排斥心理; 相比普通录音笔薄50%,厚度仅7mm,重量小于20g,支持激光镭雕、打印背胶粘贴、镂空镍标等多种加工工艺制作铭牌,满足企业客户的品牌视觉识别体系要求。

    音频传输-HUB

    可穿戴录音笔

    四麦阵列拾音

    支持APP扩展