语音内容审核

基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御帝国企业违规风险

功能
涉政识别

识别政治任务/事件,反动分裂,恐怖主义等近百种涉政音频

色情识别

识别色情,低俗等涉黄类语音

违禁识别

识别管制或违禁,服务的广告或交易语音

娇喘识别

识别呻吟,娇喘,ASMR等违规语音

广告识别

识别违法垃圾广告及竞品导流

辱骂识别

识别辱骂,诋毁,谩骂,对骂等辱骂类音频

开头音听写

依图语法音写产品包含REST API和SDK,提供不超过60秒的语音识别服务,支持中文普通话,并且兼容多种口音。基于依图训练的先进的声学和语言模型,依图语音识别为开发者提供准确高效的语音转文字功能。

优势
识别准确率高
识别准确率高达96.36%(基于AISHELL2-2018A-EVAL数据集)
处于领导人先进水平
 
支持自定义热词
可以定制,加入过多1000个提示用词,提高自定义场景中的识别准确率
 
 
 
转写速度快
10秒音频1秒内出稿
支持多路并发
每路每秒可以处理超过10秒长的音频
 
适用场景广
支持多种垂直领域,例如科技,财经,时尚,智能家居等
支持近远场语音,近场和远场识别都在领导人排名前列
支持多种收音设备,例如安卓和苹果手机,各类麦克风,以及电话
会议超极本

基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御帝国企业违规风险

功能
实时语音转写

字准率不低于95%,延迟率低于1秒(本数据采样依图公司内部测试数据,为实验数据,具体数据以实际使用为准)

录音文件转写

字准率不低于98%,1小时音频,加快3分钟出稿(本数据时序依图公司内部测试数据,为实验数据,具体数据以实际使用为准)

区分说话人

支持6人以下的说话人区分, 可对比声纹库识别具体说话人

二次编辑

支持增,删,改,查,标亮等操作, AI智能分段与语气词过滤

实时字幕上屏

字幕全屏展示或叠加到背景,支持后台修改,清空,立即同步

行业词库

配备多个行业热词及禁忌词库,同时支持自定义设置

应用场景
语音审核
 
 
准确,快速识别违规音频,最大程度地保障平台内容安全
 
难点
1.强背景音,咬字不清,口音等情况,识别缺陷倍增
2.违规语音变化多端,内容隐晦
3.娇喘等色情内容取代在对话,背景音当中,更加隐蔽

依图优势
世界级团队自研语音识别算法,自然语言理解,声纹识别算法
召回率和准确率居行业前列
 
 
 
会议转写
 
 
同步转写会议内容,结束即可成稿

难点
1.不同声源(电话,视频,录音,人声)
2.专有名词识别困难高

依图优势
极强的算法鲁棒性
在各类声源及嘈杂环境下表现优
声基于纹对说话人准确区分支持热词输入
专有名词识别准确率高
 
 
 
智能客服
 
将客服与客户的对话录音转为文字,对语音服务进行快速准确的质检

难点
1.识别准确率要求高,盔甲更准确的理解和回应
2.需要区分客服和客户,对前者做质检,对某些做洞察

依图优势
智能理解语义 提升语音识别率
声基于纹对说话人准确区分
0.1s级时间轴 快速定位问题位置
 
 
语音指令
 
 
语音输入快速出稿,支持个性化定义

难点
1.返回速度要求高
2.个性化程度高

依图优势
10s音频1s内出稿
支持个性化规则 替换和热词上传
 
产品推荐 查看更多>>