立即咨询

电话咨询

微信咨询

立即试用
商务合作

声网 Agora 一站式智能语音识别方案

2019-09-17

视频直播,语音聊天,音乐社交,这些与“声音”相关的社交场景在过去两年中变得越来越热,并吸引了许多内容创作者和用户。但是,相关的语音内容审查一直是许多平台的头疼问题。这也使得“每日聆听4000种声音”的声音成为头条新闻。现在,市场上的一些厂商已经开始提供智能语音黄变服务,大大减少了人工黄变的工作量。

然而,对于社会产品团队来说,现有的语音内容审计+实时音视频服务、部署、调试、运行和维护成本都很高,许多方案对背景音乐和噪声的音频识别效果都很差。为了解决这个问题,我们正式推出了Agora一站式智能语音识别方案。

所有现有的计划是如何运作的?

一般情况下,一个社会产品需要与三家制造商对接:CDN制造商,用于推送流和拉流,并实现正常直播;RTC制造商用于实现低延迟的实时交互直播;内容审查制造商通过人工智能手动进行审核。Access的体系结构基本如下图所示,可以简单地概括为三个步骤:

1.内容被转码或直接推送到CDN;

2。内容审计供应商从内容交付网络(cdn)中撤出,然后进行人工智能和手动内容审计。

3.审计完成后,将返回到服务器。

图:传统的实时音视频内容评审过程

这种旧方法引起的问题是显而易见的。首先,开发人员需要停靠三个供应商,并且必须多次部署和调试。调试有很多成本和风险。此外,当CDN失败时,需要很长时间来解决问题。此外,在此过程中,开发人员还需要支付额外的拉流成本。

另一方面,目前的方案也需要解决噪声问题。由于音频社会交互的场景很多,如语音调频、语音聊天室、音乐社交、娱乐直播等,这些场景往往伴随着环境噪声和背景音乐,这将影响现有内容审核方案的识别率。

一种用于声音网络的AGORA一站式智能语音识别方案

目前,语音网络已经为业界提供了独一无二的一站式智能语音识别方案.如上述体系结构所示,开发人员只需在应用程序中集成声音Mesh AgoraSDK,就可以使音频在AgoraSD-RTN™网络中实时传输过程中完成语音内容的识别和审查。在原有的现场语音互动直播的基础上,我们整合了业界三大语音识别服务。同时,基于音频网络的人工智能音频降噪引擎,提高了语音质量,优化了语音识别效果。

语音识别过程如下图所示。首先,由声音网络专门开发的AI音频降噪引擎消除了背景声音,优化了音频质量,并使声音更清晰。我们在网络广播,语音约会和其他互联网平台上听到的语音音频通常有两种类型,一种是普通语音,另一种是非文本声音,如娇川和ASMR,后者没有任何语义。因此我们将通过不同的模块检测,将语音转换为文本并进一步过滤内容安全引擎,结合“多意义上下文短文本垃圾邮件检测”,“深度学习垃圾检测”,“规则引擎”和“分类器”模块过滤掉非法内容,如政治,泛黄(包括娇川,ASMR),惶恐不安,以及音频中的辱骂。人工审核团队可以通过网络背景对机器审核结果进行随机检查和审核,并不断优化机器审核的准确性。此过程可以显着降低手动审核的成本并提高效率。

目前,该解决方案可以检测到广告、色情、政治、暴力和滥用等非法内容。适用于直播视频、语音聊天室、娱乐直播、语音调频、音乐社交网络等实时音视频社交场景。

agora一站式智能语音识别计划的优点包括:

1

调用RESTfulAPI,一站式访问

Sound Network Agora目前提供实时音频呼叫SDK。通过在您的应用中集成Agora SDK,开发人员可以通过调用RESTful API为其应用添加语音内容审核。与传统的内容审计解决方案相比,完善的网络解决方案可以节省开发时间,服务器和其他访问成本。

2

AI 降噪,识别率更高

面对语音识别中常见的噪声、背景音乐等音质问题。通过人工智能音频去噪引擎对音频进行优化,提高语音识别率。同时,用户的语音和音频体验也会得到改善。在今年的RTC2019实时互联网会议上,我们将进一步分享人工智能音频去噪背后的技术实践。请期待。

3

语音交互低延时

声网sdk实现了从全球终端到终端76ms的实时音频和视频低延迟传输。声网agora sd-rtntm实时通信网络采用专用的udp协议进行传输,根据软件定义和优化路由选择最优传输路径,自动避开网络拥塞和主干网故障的影响。在保证低延迟传输的同时,声网agora sdk还支持48kz的高质量语音。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

热门数字化产品

埃文科技IP风险画像埃文科技IP风险画像基于多维度数据信息、持续性IP风险验证机制和多级IP风险判定算法,实时关联IP的位置信息、应用场景、端口服务和设备风险信息等进行IP风险精准判定,并实行IP风险赋分、风险分级机制,简化业务应用门槛。IP风险画像产品可覆盖识别7种类型的风险IP,分别是VPN、代理、秒拨、数据中心、Tor节点、端口扫描、暴力破解。
Zoho Projects项目管理软件Zoho Projects项目管理软件,帮助您轻松地进行项目规划、进度跟踪、内外协作。它利用工时统计、Bug管理、项目知识库管理等功能,帮助您实现业务目标。为您的项目管理工作提供全面综合的解决方案,从而帮助您和您的企业大幅创造价值。
阿里云无影云电脑阿里云无影云电脑(WUYING Workspace)是一种易用、安全、高效的云上电脑,支持快速便捷的创建、部署和统一运维管控。自带多重安全管控能力,支持随时随地访问,资源灵活弹性。广泛应用于安全办公、协同研发、教育实训、私域运营、分支门店、客服办公等。
上讯信息敏捷数据脱敏系统SDM敏捷数据管理平台软件(ADM)是上海上讯信息技术股份有限公司(以下简称“上讯信息”)自主研发的,主要面向金融、运营商、政府、能源、医疗等行业打造的全生命周期数据安全管理软件产品,用于数据备份、备份数据恢复验证、测试数据交付和静态数据脱敏等应用场景,可为企业上、中、下游数据的高效使用和安全管控提供一套整体解决方案。
腾讯云服务器CVM腾讯云云服务器致力于提供安全稳定、高弹性的计算服务,为视频、游戏、金融、互联网等行业知名企业及个人开发者提供稳定的计算服务。支持基于快照创建云盘,支持快照跨地域复制。 一键开启云盘加密,满足安全和认证的需求;基于overlay技术构建逻辑隔离网络空间VPC; 安全组、网络ACL。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
企业如何选择可观测平台?从需求到落地的全流程选型指南

企业如何科学选型?云巴巴将从需求诊断到落地实践,来帮助有需求的企业梳理选择方向。

2025-05-09
快麦小智大更新!客服效率翻倍,复购率飙升秘籍全公开!

上个月快麦小智再次推出多项重磅功能更新,从知识库优化到营销链路升级,全面赋能商家实现效率与复购率的双重跃升。

2025-05-09
网站卡顿、数据泄露频发?网宿WAS_CDN秒级响应+全链路加密护航企业数字化转型!

网宿科技全站加速WAS_CDN通过“三重融合”技术架构,为企业提供“降本-增效-合规”一体化解决方案,在保障业务连续性、数据安全性的同时,实现用户体验与运营效率的双重跃升。

2025-05-09
Jira还是TAPD?游戏团队选型避坑指南来了!

如何选择一款适配游戏研发特性的项目管理工具,成为团队突破“版本延期魔咒”、抢占市场先机的关键。

2025-05-09
查看更多