低功耗高性能 | 全场景降噪 | 差异化方案 | 一站式服务。
算法优势: 1. 骨导传感器提供的信号对高噪声场景(如运行的地铁、大风噪等)有着更好的消噪效果,通话无障碍; 2. 骨导传感器提供的音频能量集中在低频部分,通过算法DNN等调整校准,输出的处理音频人声保真度高, 不显得人声过于发闷; 3. 通过融合FF & talk mic的信息(如果有FB mic,也会参考FB mic 信号),结合深度学习算法,对稳态 与非稳态噪声消除好。
风噪:跑步、骑行、车载 嘈杂场景:地铁、酒吧、公交车、十字路口;突发噪声:汽车鸣笛、地铁开关门。
遍历所有的情况进行端到端测试并保存通话音频,将最终的音频上传至评测平台进行测试,保证用户的体验。
评估与验证:对市面上的主流耳机进行定向测试、拆解,分析优劣势场景与设计初衷;自研mockup覆盖不同间距、不同防尘网、不同开孔方向、不同形状等;验证不同硬件与结构设计对算法的影响,完善参考设计并定向进行算法优化。
场景
|
具体场景
|
延时要求
|
偏安静
|
安静的家居、安静的图书馆、安静的健身房
|
响应时间为3s,恢复时间
为4s
|
中等噪声
|
嘈杂的会议室、办公室
|
响应时间为3s,恢复时间
为4s
|
重度噪声
|
火车运行时、高峰期城市街道,高峰期购物中心
|
响应时间为3s,恢复时间
为4s
|
风噪
|
弱风噪
|
风噪响应为3s以内,强风
噪切换到弱风噪/无风状态
在8s左右响应
|
风噪 |
强风噪
|
风噪响应为3s以内,强风
噪切换到弱风噪/无风状态
在8s左右响应
|
具体场景
|
地铁场景/非地铁场景、机场场景/非机场场景等
|
场景
|
具体场景
|
准确率
|
偏安静
|
安静的办公室、安静的家居、安静的会议室、安静的健身房
|
95%
|
中等噪声
|
高峰期的餐厅、咖啡厅
|
95%
|
重度噪声
|
高峰期的地铁站(内)、高铁站、公交车站
|
95%
|
风噪
|
骑行
|
98%
|
本测试基于恒玄平台,测试环境为日常办公室场景,底噪约为50-60dB。
Apollo3平台实测数据: 备注:1580词,固定说法80词+不固定说法 设置闹钟 1440词+不固定说法 倒计时 60词 • 资源占用:RAM 55KB、Flash 160KB、算力45M • 误识别率:所有词一直启用的情况下,18h 10次 • 功耗:一直启用的情况下,1.14mA@5V。
实时转写:速度快,准确率高,支持支持2~6个说话人分离语音速记:支持天津、山东、东北、湖北、福建、河北、贵州、陕西等地口音多语种:支持普通话、英语、中英混说、粤语、四川话和上海话翻译:支持中英、英中等主流语钟文本翻译 极速出稿:支持录音文件转写,录音1小时、5分钟出稿 同声传译:普通话语音输入、翻译文本输出。
在疫情防控期间,依托磐云安全防护系统及企业浏览器,为各政企单位 提供SDP(软件定义边界)解决方案,可帮助各级政企单位内部员工在 远程办公的过程中,隐藏核心网络资产与设施
高效稳定
功能完备
一款包括开头语音听写、长语音转写、语音内容审核、会议超极本等功能产品在内的语音平台,基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解 和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御企业违规风险
应用广泛
丰富场景
功能完备
思必驰智慧物联解决方案基于海量声学和文本数据,提供以任务型对话为主,兼具闲聊和问答的综合性对话服务。提供通用的内置技能;支持自定义对话逻辑和内容;细致到每一轮交互的超高度定制。
全链路对话
超高度定制
语音输入板
声纹识别