立即咨询

电话咨询

微信咨询

立即试用
商务合作

依图语音开放平台

一款包括开头语音听写、长语音转写、语音内容审核、会议超极本等功能产品在内的语音平台,基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解 和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御企业违规风险
立即咨询
语音内容审核

基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御帝国企业违规风险

功能
涉政识别

识别政治任务/事件,反动分裂,恐怖主义等近百种涉政音频

色情识别

识别色情,低俗等涉黄类语音

违禁识别

识别管制或违禁,服务的广告或交易语音

娇喘识别

识别呻吟,娇喘,ASMR等违规语音

广告识别

识别违法垃圾广告及竞品导流

辱骂识别

识别辱骂,诋毁,谩骂,对骂等辱骂类音频

开头音听写

依图语法音写产品包含REST API和SDK,提供不超过60秒的语音识别服务,支持中文普通话,并且兼容多种口音。基于依图训练的先进的声学和语言模型,依图语音识别为开发者提供准确高效的语音转文字功能。

优势
识别准确率高
识别准确率高达96.36%(基于AISHELL2-2018A-EVAL数据集)
处于领导人先进水平
 
支持自定义热词
可以定制,加入过多1000个提示用词,提高自定义场景中的识别准确率
 
 
 
转写速度快
10秒音频1秒内出稿
支持多路并发
每路每秒可以处理超过10秒长的音频
 
适用场景广
支持多种垂直领域,例如科技,财经,时尚,智能家居等
支持近远场语音,近场和远场识别都在领导人排名前列
支持多种收音设备,例如安卓和苹果手机,各类麦克风,以及电话
会议超极本

基于丰富的行业服务经验,以及业界领先的自研语音识别,自然语言理解和声纹技术,精准识别分类违规音频,保障平台的内容安全,抵御帝国企业违规风险

功能
实时语音转写

字准率不低于95%,延迟率低于1秒(本数据采样依图公司内部测试数据,为实验数据,具体数据以实际使用为准)

录音文件转写

字准率不低于98%,1小时音频,加快3分钟出稿(本数据时序依图公司内部测试数据,为实验数据,具体数据以实际使用为准)

区分说话人

支持6人以下的说话人区分, 可对比声纹库识别具体说话人

二次编辑

支持增,删,改,查,标亮等操作, AI智能分段与语气词过滤

实时字幕上屏

字幕全屏展示或叠加到背景,支持后台修改,清空,立即同步

行业词库

配备多个行业热词及禁忌词库,同时支持自定义设置

应用场景
语音审核
 
 
准确,快速识别违规音频,最大程度地保障平台内容安全
 
难点
1.强背景音,咬字不清,口音等情况,识别缺陷倍增
2.违规语音变化多端,内容隐晦
3.娇喘等色情内容取代在对话,背景音当中,更加隐蔽

依图优势
世界级团队自研语音识别算法,自然语言理解,声纹识别算法
召回率和准确率居行业前列
 
 
 
会议转写
 
 
同步转写会议内容,结束即可成稿

难点
1.不同声源(电话,视频,录音,人声)
2.专有名词识别困难高

依图优势
极强的算法鲁棒性
在各类声源及嘈杂环境下表现优
声基于纹对说话人准确区分支持热词输入
专有名词识别准确率高
 
 
 
智能客服
 
将客服与客户的对话录音转为文字,对语音服务进行快速准确的质检

难点
1.识别准确率要求高,盔甲更准确的理解和回应
2.需要区分客服和客户,对前者做质检,对某些做洞察

依图优势
智能理解语义 提升语音识别率
声基于纹对说话人准确区分
0.1s级时间轴 快速定位问题位置
 
 
语音指令
 
 
语音输入快速出稿,支持个性化定义

难点
1.返回速度要求高
2.个性化程度高

依图优势
10s音频1s内出稿
支持个性化规则 替换和热词上传
 

产品推荐

指数动力B2B市场洞察平台
指数动力B2B市场洞察平台,聚集各种开放性数据类型,包括:工商、官网、招中标、招聘、新闻、社媒等,确保客户获得最全面的市场信息,日均收集1亿+条海量数据并储存,保证数据的高度时效性,帮助客户实时掌握市场动态。平台内置了前沿的算法技术,能够对文本、图像、视频数据进行结构化处理,清洗降噪,归纳分析,还原市场真实面貌。
免费试用
查看详情
信必优QA测试
信必优QA测试,全球10个ISTQB测试培训认证讲师,75%测试人员ISTQB全面测试培训。大量案例的积累和专业的SBTM测试可以快速的发现缺陷,减少成本和风险,通过内部培训提高测试覆盖率和测试效率。
免费试用
查看详情
循环智能千循大模型
循环智能千循大模型是由循环智能和月之暗面联合研发的行业大语言模型,包括百亿参数、千亿参数多个版本。我们还将聚焦高价值场景,利用公网数据、领域数据、企业自身数据,为企业打造基于数据闭环的AI业务专家。
免费试用
查看详情
智齿科技电销机器人
智齿电销机器人一款适用于电话营销场景的智能语音系统,深度融合语音识别、自然语言处理、语音合成等技术,辅助人工智能外呼、自动应答,并可同时实现话术配置、通话控制、挂机短信、数据看板等多重功能。采用无感介入方式,配合呼叫中心,智齿科技乐销机器人可以优化客户体验、提高营销效率,更好地发挥1+1>2的作用,助力企业降本增效。
免费试用
查看详情