立即咨询

电话咨询

微信咨询

立即试用
商务合作

严选数字化产品,

助力企业数字化转型

企业数字化  就找云巴巴

搜索
热门 热门搜索: TAPD|数字人|云服务器|智能客服|腾讯电子签
腾讯云语音识别 ASR
腾讯云语音识别技术采用自主研发的Dual Path Attention Network(DPAN)模型,通过系统融合实现对语音信号高效的建模,在不同应用场景下,具备较好的鲁棒性。
百度智能云度目凌云平台
百度智能云度目凌云平台提供智能AI硬件识别+公有云平台业务应用分析的全套方案,满足行为分析、人员管理环境检测等业务需求,让管理者看得清,听得懂,企业泛安防升级更快、更省、更放心。
腾讯云智能全屋AI语音助手
腾讯云智能全屋AI语音助手支持全链路的AI能力输出,接入云智能语音助手,直接连接腾讯特色生态内容亿级的资源、内容库。提供成熟的数字人人格化体系框架;丰富的数字人动作库可快速迁移到客户的定制形象中。
出门问问TTS解决方案
出门问问TTS解决方案是从TTS端到端语音合成引擎,合成效果媲美真人,合成语音准确、流畅、自然,领先的韵律准确率,多音字准确率业界Top 1,覆盖喜/怒/哀/乐四个维度的情绪表达,情感强度控制,让合成语音更有温度感。优化端到端歌唱合成系统,输入乐谱(musicxml/midinode),输出歌曲音频。
龙泰信息AI话术大师
爱小智是针对一些特定岗位(销售、导购、客服)日常话术学习和评测的人工智能工具。综合利用语音合成、语音识别、语音测评、语义理解等人工智能技术,模拟相关业务场景和角色,陪伴学员进行日常话术学习,并进行智慧的行为测评,具备自我学习能力。
思必驰语音语言解决方案
思必驰语音语言解决方案集成了公司的全链路智能语音语言交互技术,同时具备支撑人工智能产品开发的大规模场景化定制能力, 可以快速搭建产品原型,并进行场景化、 个性化定制。从感知智能到认知智能,从信号处理到识别到理解到交互,思必驰拥有全面的智能语音语言交互技术。
思必驰无线领夹麦解决方案
思必驰无线领夹麦解决方案成熟的声学结构设计指导说明,声学腔体仿真验证、丰富麦克风选型推荐和厂商,力求在产品前期ID设计阶段便可得到最佳腔体,节约您的人力、物力 & 时间成本,同时保证产品feature算法的最优化,深化产品的竞争力!
思必驰手机音频解决方案
思必驰手机音频解决方案可以盲人/聋哑人应用、智能场景识别、自定义唤醒、语音解锁密码、与可穿戴设备联动、全双工人机对话、语音转文本、方言与翻译、语音+图像识物,以及不再拘束于唤醒词,提供更自然的语音交互能力。在我们的日常生活中,不会和别人说话时每说一句话就叫对方名字一次,全局生效或者在应用内生效,如拍照摄影、游戏控制、音乐播控。
思必驰平板音频解决方案
思必驰平板音频解决方案核心算法基于传统信号处理+深度学习技术,结合麦克风阵列进行前端降噪,不受限于噪声类 型,覆盖低信噪比全场景,大幅提升通话清晰度,改善噪声环境下的通话质量.
魔音工坊AI配音平台
魔音工坊AI配音平台拥有全能创新的音频合成编辑功能,成熟的应用商店能够南腔北调,语种多样以及情感合成,情绪多变。同时网页、小程序和APP,一个账户,多端通用,是短视频AI配音行业第一品牌。
腾讯云小微智能硬件AI语音助手IHAVA
腾讯云小微智能硬件 AI 语音助手(Intelligent Hardware AI Voice Assistant,IHAVA)为您提供前沿的 AI 语音全链路能力、硬件方案咨询及认证服务,整合腾讯系优质内容和服务,面向智能硬件行业打造全方位的自然人机交互体验。
依图科技实时长短语音转写
依图科技实时长短语音转写,提供不超过60秒的语音识别服务,提供长达5小时的语音识别服务,支持中英混读,并且兼容多种口音。提供流式语音识别能力,一边接受音频数据,一边提供转写结果。
科大讯飞语音调度系统
通过讯飞语音识别技术,精准命中调度指令,结合NLP语义理解,将文本信息转换成机器指令传入系统,进行具体事项操作,同时还可以加入TTS语音合成技术,在执行指令时,进行状态播报,以达到人机交互,准确把控指令操作。
腾讯云智聆口语评测SOE
智聆口语评测(Smart Oral Evaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,支持单词、句子、段落、自由说等多种模式,支持发音准确度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中文及英语口语类教学中。
腾讯云声音工坊TTSW
腾讯云声音工坊( TTSW )提供定制音色的能力,满足客户定制化需求。通过先进的深度学习技术,根据客户实际业务情况,提供不同的定制方案,从而更有效、更专业地服务实际业务需求。普遍适用于智能客服、智能硬件、在线教育、有声阅读、新闻播报等场景,通过训练专属业务音色,从而更好的服务业务场景,提升交互体验。
腾讯云语音合成TTS
语音合成(TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
腾讯云语音识别ASR
腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。
依图语音开放平台
一款包括开头语音听写、长语音转写、语音内容审核、会议超极本等功能产品在内的语音平台,基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解 和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御企业违规风险
兰亭译人机合译平台
兰亭译(Lightingyee)是所见即所得的人机合译平台。整合神经网络机器翻译、交互式机器翻译、所见即所得的在线编辑技术,为译者和翻译企业提供的神经网络机器翻译时代新翻译工具。
智能语音交互
阿里智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。
声纹识别
声纹识别(Voiceprint Recognition)也称说话人识别 (Speaker recognition),是根据人的声波特性进行身份辨识的服务。可以将说话人声纹信息与库中的已知用户声纹进行1:1比对验证和1:N的检索。