腾讯同传系统TSI_会议同传系统_会议同传机器人

申请试用

腾讯同传系统TSI

腾讯同传系统能够智能的帮助企业提升日常办公效率和准确度。腾讯同传系统基于语音识别、语义理解、机器翻译等人工智能技术，结合机构、企业办公应用场景，提供中英文互译、中英文实时转写、会议记录编辑成稿、角色分离、历史文件管理、效果优化等功能

立即咨询

首页 > 产品中心 > 智能机器人 > 腾讯同传系统TSI

产品概述

腾讯同传系统能够智能的帮助企业提升日常办公效率和准确度。腾讯同传系统基于语音识别、语义理解、机器翻译等人工智能技术，结合机构、企业办公应用场景，提供中英文互译、中英文实时转写、会议记录编辑成稿、角色分离、历史文件管理、效果优化等功能。

功能架构

腾讯同传可灵活适应多种语音场景下的使用需求。也提供智能优化功能，用户可根据业务需求，定制识别翻译内容，以保证识别与翻译的准确性。软件由两大核心功能构成：基于音频的流式识别，实时获取转写、翻译结果。该功能侧重实时语音输入、识别/翻译结果实时获取、同步展示投屏、同步输出会议纪要等即时性需求。基于音视频文件上传，异步获取转写、翻译结果。该功能侧重基于音视频文件进行转写，以及二次编辑、整理成稿等非即时性需求。

产品特性

准确率高

腾讯同传系统 AI 引擎由腾讯核心 AI 团队（微信智聆与腾讯翻译君）联合打造，普通话识别准确率可达97%。机器翻译核心引擎 NMT 基于目前先进的 Transformer 模型，在国际翻译大赛中获得中英方向世界第一，翻译可接受度超92%。

定制优化

腾讯同传系统提供可视化的训练配置页面，用户根据其业务场景自定义完成语音识别、机器翻译结果的优化，有效提升特定词汇的识别与翻译准确率，满足不同行业定制化的语言需求。

安全稳定

腾讯同传系统的语音识别引擎日均请求量4亿次，日均处理行业语音5万小时。腾讯同传系统的翻译引擎日均翻译请求5亿次，方案部署各垂直行业，在复杂应用环境下均有良好的识别与翻译效果。

应用场景

会议实时记录

在企业、政府的日常工作会议中，根据三重一大议事原则，会议必须全程留痕且需要归档备查，当前多采用人工记录的方式，存在出稿效率低、内容不完整、纸质文件后期引用难等问题。通过腾讯同传系统可以实时记录、实时编辑会议记录，可以直接导出 word 文档方便会议存档。

涉外会议实时翻译

在涉外会议中，会议双方由于语言障碍，通常需要外聘翻译人员进行翻译，在增加了会议费用成本的同时，又扩大了会议内容的传播范围。腾讯同传系统利用先进的机器翻译技术，可以实时进行中英互译，有效较低了中外双方的沟通难度，减少会议的成本和控制了会议内容的传播范围。

会议字幕实时上屏

在大型会议下，现场存在嘈杂、声音小、讲话人语速过快等因素，影响观众有效获取信息，尤其是涉及双语交流的场景。通过腾讯同传系统的实时上屏功能，只需一台电脑就可直观展示宣讲内容与翻译内容，减少会议方对同声传译、同传设备的费用开支。

个人速记

在企业领导、政府官员在日常交流和会议中，经常会口述信息，需要秘书对内容进行文字记录；作家、编剧、记者等文字职业，也会存在大量的需要将口述内容变成文字的诉求。通过腾讯同传系统可实时记录口述内容，也可以会后对录音文件转写直接生成文稿，提高个人工作效率。

录音转写

针对通过其他录播系统或录音设备获取的非实时的音频文件，系统支持导入历史录音进行快速转写，1个小时的音频文件约6-8分钟即可完成转写，且转写结果会自动分段，支持转写结果按句播放，提升转写结果的阅读性和编辑效率。

核心技术—语音识别引擎 icon

语音识别技术（Automatic Speech Recognition）是一种实现从“声音”到“文字”转换的技术，通过将人的语音直接转换成相应的文本以便计算机进行理解和产生相应的操作，并最终实现人与机器之间的自然语音交互。腾讯同传系统采用国内广泛应用的微信智聆语音识别引擎，针对语音识别应用中面临的方言口音、背景噪声等问题，基于开放业务系统中所收集的涵盖不同方言和不同类型背景噪声的海量语音数据，通过先进的区分性训练方法进行语音建模，使语音识别引擎在复杂应用环境下均有良好的效果表现。

腾讯同传系统所应用的引擎具备的前端特性如下

支持中/英文语音转写

语音识别对于日常使用的常用对话有着很高的识别准确率，包含短信类、生活、交通、娱乐、科技、数字数值、名人、互联网热词、新闻等领域，其中中文标准普通话语音识别准确率最高可达97%以上，Native 英文整句识别准确率可达到93%以上。

支持标点智能预测

语音识别使用超大规模的语言模型，对识别结果语句智能预测其对话语境，提供智能断句和标点符号的预测。

端点检测

端点检测是对输入的音频流进行分析，确定用户说话的起始和终止的处理过程。一旦检测到用户开始说话，语音开始流向识别引擎，直到检测到用户说话结束。这种方式使识别引擎在用户说话的同时即开始进行识别处理。

噪音消除

在实际应用中，背景噪声对于语音识别应用是一个现实的挑战，即便说话人处于安静的办公室环境，在语音中也难以避免会有一定的噪声。语音识别系统应具备高效的噪音消除能力，以适应用户在千差万别的环境中应用的要求。

大词汇量、独立于说话人的识别功能

满足大词汇量、与说话人无关的识别要求。产品可以支持数万条语法规模的词汇量，并能适应不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境。

敏感词过滤

接入腾讯统一的敏感词过滤服务，以实现可靠的敏感词过滤，避免实时会议展示敏感内容。

本次系统具备的前端特性如下

词汇识别系统

满足大词汇量、与说话人无关的识别要求。可以支持数万条语法规模的词汇量，并能适应不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境。

置信度输出

置信度反映了识别结果的可信程度。语音识别引擎可以在返回识别结果时携带此识别结果的置信度，应用程序可以通过置信度的值进行分析和后续处理。

多识别结果

又称多候选技术，在某些识别过程中，识别引擎可以通过置信度判决的结果向应用程序返回满足条件的多个识别结果，而不是唯一的结果。识别系统提供了可能的识别结果列表，并按置信度结果从高到低进行排列。在业务设计中，可以根据应用要求向工作人员提供这些结果，供工作人员进行二次选择。通过置信度判决和多识别结果输出技术可以开发更加灵活、更加人性化的业务流程。

热词识别系统

热词识别使得语音识别应用程序能够在说话者说话的同时检测一个特定的词或短语。

核心技术—机器翻译引擎 icon

核心引擎 NMT 基于目前先进的 transformer 模型，并融合新型循环神经网络，在提升了训练效果的同时，翻译质量更佳，翻译速度更快。有效结合序列自注意力模型和循环网络模型的优势，实现了两个模型的优势互补，在保证翻译质量的前提下，提升翻译速度，能够满足更多的实时性翻译需求。

应用引擎翻译能力包括如下几种

支持进行本地上传所需定制的词汇内容，针对敏感度高、优先级高的重要特殊词汇（例如领导人名字、政府机构、地名、缩写简称、专有词汇、行业术语等）秒级生效。具备对文稿中专有名词、缩写简称、行业术语等特殊词汇的处理能力，并正确翻译成指定内容。例如一带一路、APEC、两会等。针对语言风格、翻译记忆等需要长期时间与大量数据积累的内容，可提供上传与保存工具，积累到一定量级后，由专业人员进行现场训练。可处理混合在一起的文稿，并正确翻译成指定语种。可自定义关键词、关键字，并设定翻译结果。可自动识别文本中自定义的关键词、关键字，并按指定结果进行翻译。

客户案例