思必驰平板音频解决方案_智能音频降噪系统_智能语音识别系统-云巴巴 -云巴巴

立即咨询

立即试用

商务合作

思必驰平板音频解决方案

思必驰平板音频解决方案核心算法基于传统信号处理+深度学习技术，结合麦克风阵列进行前端降噪，不受限于噪声类型，覆盖低信噪比全场景，大幅提升通话清晰度，改善噪声环境下的通话质量.

立即咨询

通话场景痛点

噪声环境复杂
多噪声源、干扰人声、本机播放噪声婴儿啼哭、电视声、狗叫、键盘鼠标敲击声、电风扇、空调声等点击鼠标声等。

交互体验差
市面主流方案更多是对上行进行降噪，远端噪声没有解决非稳态噪声，特别是干扰人声，消除难，业界难题结合声纹、图像等方案前置条件/门槛高。

需兼容不同外设
外接有线耳机，需考虑对应信号的兼容性。

需兼容主流通讯平台
通过Teams、微信、钉钉、Zoom、WebEx、腾讯会议等通讯平台进行通讯，需考虑对应信号的兼容性。

评价指标多种难统一
业界标准不一，比较经典的是teams测试主观体验和客观评测难统一结合声纹、图像等方案暂无标准评价指标。

思必驰AI背景降噪

核心算法基于传统信号处理+深度学习技术，结合麦克风阵列进行前端降噪，不受限于噪声类型，覆盖低信噪比全场景，大幅提升通话清晰度，改善噪声环境下的通话质量；双麦/四麦算法，分全向模式和定向模式，最远支持双麦3m/四麦5m拾音降噪。定向模式可以针对固定角度进行音频增强。单麦算法，适合近场，可搭配耳机一起使用。

性能表现优秀

客观测试

Teams预测试关键指标，发送MOS：4.2，上行延时：算法60ms以内，回声抑制：60dB，双讲人声衰减<12dB Whisper测试关键指标，ns>20dB，speech loss<3dB

主观体验

噪声可以解决平稳噪声，可以部分解决非平稳噪声，可以解决回声，可以部分解决混响问题，支持远距离拾音人声，无延迟保真度高，清晰，双讲，人声连续，可懂度高

Dmic降噪效果对比_手机铃声测试，距离mic最近距离 1cm icon

Dmic降噪效果对比_定向干扰人声消除测试 icon

Dmic降噪效果对比_单点干扰源噪声测试 icon

Amic（3.5mm）降噪效果对比_单点噪声测试 icon

上行通话降噪plus，只保留主说话人声音——NFP方案 icon

只保留扇形区域主说话人声音，去掉扇形区域外背景噪声和干扰人声，最左最右麦克风间距240mm，扇形区域半径50cm。

上行通话降噪plus，只保留主说话人声音——NFP方案音频效果 icon

上行通话降噪plus，只保留主说话人声音——多模态交互方案 icon

上行通话降噪plus，只保留主说话人声音——声纹voice filter方案 icon

远端降噪——下行通话降噪

目前业界语音降噪方案更多是对近端进行降噪，远端降噪/下行通话降噪可以消除对方传过来的背景噪声，即使对方所在背景环境噪音嘈杂，仍然可以听到对方清晰的通话内容；

支持喇叭播放/3.5mm耳机输出；

噪声模型能识别并消除多种噪声类型，并持续迭代升级；

噪声抑制深度30dB+。

带来的客户价值

极致通话体验
不仅对方听得清，自己也听得更清

场景丰富，支持扩展
不受限于噪声类型

支持远场拾音

支持细分领域的定制

接入灵活，快速可用
APO形式接入，也支持更低功耗GNA版本接入支持Windows、Andorid、Linux等操作系统

对接流程清晰，周期短 icon

全链路语音服务

实时语音识别
反馈速度快

延时率低：<0.2秒

垂直领域定制识别

企业尊享服务
定制服务好

领域定制VIP服务

企业尊享私有云部署

录音文件识别
准确率高

通用识别

一句话识别
又准又快

通用识别：>95%

响应时间:<6秒

ASR主要产品类型

实时语音识别
对连续的音频流做实时识别，配有内置的智能断句，达到“边说边可见”的效果。可用于大会演讲投屏、实时直播字幕、实时法庭庭审记录等场景

录音文件识别
对用户上传的录音文件或文件链接中的音频进行识别。可用于采访录音转写、庭审数据录入、会议记录总结等场景。

一句话识别
对时长较短（一分钟以内）的语音进行整句识别，通常适用于音频长度较短且能接受有延迟的获得识别结果的场景，语音识别准确率通常会高于流式方式。应用场景包括：即时通讯语音转写等，可集成在各类App、即时通讯软件中

产品优势

速度快、准确率高
字级深度序列网络CTC建模，识别更快速、更精准

支持说话人聚类
智能区分不同说话人识别结果，文本展示一目了然

完善的自训练功能
支持自训练语言模型、自定义热词、敏感词，显著提升自定义场景识别体验

口语顺滑
自动过滤语气词，重复词，转写结果更流畅

安全可靠
99%服务可用性，加密数据协议，数据切片处理，纯机器计算。

配置灵活
弹性扩容，支持高级客户专属转写队列。

声纹注册、验证过程

声纹确认示例

训练平台能力蓝图

定制专属模型，优化识别效果 icon

专业术语、地名、人名等特殊指代用词往往影响着对话效果，同样，环境噪音、方言口音、中英混杂、语速等因素都会对对话效果产生不良影响。通过专属模型定制，相对提升识别性能，满足业务多样化需求。

缩短交付生产链路，提高规模化定制能力 icon

已有的研发交付链路长，沟通成本高，用户在开发过程中过度依赖语音厂商，自主权不够。思必驰DUI标注训练一体化平台，将数据标注和模型定制能力赋能用户，大大优化了生产链路。用户可独立完成所有流程，语音厂商不参与其中，满足规模化生产需求。

训练标注一体化平台优势 icon

识别率提升
从不可用到可用，解决两大核心问题：重口音、方言识别不准；领域专业词汇、术语的精准识别

私有化部署
私有化部署，更安全、更好用：基于客户自身的服务器部署，私密数据的安全性更有保障；数据均在本地，更方便基于数据的管理和二次开发

行内首家
业内首家标准训练一体化解决方案：基础训练见效快，产品功能丰富，稳定的产品迭代

两大产品形态
灵活便捷一体机+高算力服务器两类产品：一体机「软件 + 硬件」结合，笔记本大小，轻松携带，方便调度，开箱即用，服务器版本适用大数据量情况

标杆案例

主动降噪（ANC）

思必驰PC ANC_自适应控制方案 icon

疫情下，用户通常通过PC居家办公或打游戏，当CPU负载较高或者用户在玩高负载的游戏应用时，风扇噪声会逐渐增大，会干扰到用户的使用体验。通过探索一种区域性降噪的技术，让处于该区域的人员人耳接收到的风扇声音明显降低，从而提高用户的使用体验

产品推荐

锐捷普教极简以太彩光网络解决方案

锐捷普教极简以太彩光网络解决方案，整合普教二层无源全光组网系统与彩光传输校园网系统。可实现校园网络无源化部署、彩光高效传输，适配中小学教室、图书馆等场景，简化布线与运维，降低成本，保障网络稳定，助力普教构建极简、高效的校园网络环境。

免费试用

查看详情

ZEGO即构虚拟场景解决方案

ZEGO即构虚拟场景解决方案，支持文本、表情、图片、语音、视频、文件、自定义消息等全消息收发，玩法丰富多样化。提供单聊、群聊、聊天室等多种会话形式，支持高并发消息处理，多端消息同步，群组成员管理。支持多种推送方式，如广播推送、用户发送、标签发送，及时地向应用程序的用户推送通知或者消息。

免费试用

查看详情

艾利特协作机器人

艾利特协作机器人是面向柔性制造的新一代灵巧机器人，重量轻、体积小、功能强大能更灵活地满足应用和行业需求，适于搬运、装配、检测等多种工艺和应用。高负载自重比，部分机型性能远超过国外同类产品完善的安全功能和高等级的产品性能，国际领先。灵敏的拖拽示教和面向应用的界面设计，入手简单、示教简单。高自研率+面向应用的产品快速迭代能力，性价比高。完善的二次开发接口和界面扩展能力，通用性强。

免费试用

查看详情