面向数字化产品和技术的学习、交流平台
达观数据 文档智能审阅系统
文档智能审阅系统采用自然语言处理技术、深度学习技术、计算机视觉等技术,打造全新的文档一体化处理系统,能自动抽取文档的关键信息、对比文档之间的差异、审核文档潜在风险、识别提取文档中的表格。现已广泛应用于金融、制造、通信、法律、审计、媒体、银行、政府等多种文字密集型行业,累计服务超100家企业,赋能企业文档流程化、自动化、智能化处理。
首页 > 产品中心 > 图文识别OCR > 达观数据 文档智能审阅系统
使用范本的合同是否只修改了可编辑区域?
对方修改了合同中的哪些内容?
打印盖章的合同是否与线上审批的最终版一致?
支持PDF、word等文档,支持图片扫描件。
自动提取上传合同出借方、采购金额等信息,提取时间控制在秒级。
提取结果表格一览,对提取结果发起机器审核,提取结果入库或导入其他系统。
漏字、多字,错字,包括音近字形近字,乱码。相关技术:分词、语言模型。
有限公司设立(369),股份公司设立(25),股权转让、融资并购(642),股权激励(213),上市/再融资(57),日常运营管理(475),合伙企业(67),其他特殊主体(53),其他特殊主体(39)
买卖转让(46792),服务类(6792),租赁类(5532),知识产权(65837),劳动用工(4628),担保(7238),民间借贷/借款(974),合作(342),赠与(232),婚姻家庭类(43233)
房地产开发与建设工程(23452),金融保险类(3432),风投私募(298),软件、网站、IT(23974),物流运输类(2037),影视剧融资、制作与发行(239),演艺、体育赛事(397),矿产资源(2987),公用事业(209),PPP及其它社会资本合作(944),其它政府、公用事业(9287),农林牧渔(834)
德勤是国际四大会计公司之一,每年需要数千位专业审计人员对几十万份文档进行人工审计(诸如合同、票据、会议纪要、法律文书等),该项工作耗时耗力, 且难免存在核查疏漏,达观提供智能文档审计系统,在文档版本比对、文档关键信息自动抽取以及审核三方面,大大帮助审计人员提升审计准确率和工作效率。
快速实现IFRS16租赁准则转换支持 用智能文档审计系统批量提取租赁合同中的关键信息(租赁期限、付款日期、租金等),输送给机器人自动化流程,实现对不 同新准则方案的有效评估。不拘泥于固定文档格式,可对文本、图片、扫描件等多种格式文档进行信息抽 取,并提供了对抽取结果的在线编辑和修订功能,不断与操作人员互动持续学习,将原来耗时、手动的作业、更快速轻松完成。系统可灵活可扩展,利用先进的监督式学习方法,支持自定义文件类型及标签,能够随时为新的文件类型训练新模型。
帮助德勤在大中华地区完成了智能审计业务的开拓(系统代号:IDRP),由于IDRP在技术创新方面所取得的突破性成果,获得了德勤亚太区授予的FY18创新大奖,并承担了拓展亚太区其他语种技术攻关的重任。
平安财务共享服务中心为整个集团各业务线条21.2万名员工提供财务审核和结算服务,每月需要审核和结算的合同类付款申请多达数万份,依靠传统的人工翻合同的方式效率较低。达观提供的财务合同智能分析系统自动提取合同中的甲乙方、金额、阶段付款安排、日期、税率等数十项关键信息,并与报销单据自动比对,实现财务一致性审核,大幅度提升财税处理效率。
实现了财务、租赁、广告等多种类型的合同数十项关键信息一键提取,能够支持Word、PDF和扫描件等多种载体。与集团内部报销系统、用印系统、合同管理系统实现无缝集成,在不改变用户操作习惯的基础上,实现了人工智能技术对传统业务的赋能增效。支持合同类型的自动扩展,客户可以通过简单的人工标注,将非结构化的合同转换为可供算法模型使用的结构化数据,通过前端可视化的页面实现合同模型的训练,完成模型训练后,就可以用来抽取合同的关键信息。
应用合同智能分析系统后,将原本800多人完成的审核工作,缩减了30%,同时审核准确率也有大幅提升。
荷兰威科成立于1836年,为全球180个国家和地区提供法律,财税,审计,风控等专业服务,是法律人士必备助手,市场占有率全球前五。本项目利用达观语义分析和机器学习技术对法律信息库5000万份判决书进行数据清洗、分类、结构化,最终提供可视化分析和搜索服务。
判决文书前后文逻辑严谨、指代众多,仅民事案当事人就区分一审、二审、再审 等不同类别几十个称谓,传统特征工程难以处理,借助Bi-LSTM等深度学习技术成功实现文书全篇幅的上下文分析计算。将法律文书自动分段、贴标签,实现信息自动分类并建立索引,使用户能够进行 跨库检索、关联搜索。开发出创新性并行算法,单份判决书提取速度小于30s,16核CPU每分钟处理 30-40份,在满足每日近十万份增量判决书处理的前提下,减少资源损耗节约成本。
较短时间内完成2700万份民事判决书127个要素提取,包括案情、原被告、律师、律所、判决结果、审判机构等,提取准确率89%,召回率92%,F值超过90%。达观基于抽取的要素和搜索技术,为法律人士提供崭新便捷的法律信息查阅视角。
常熟农商银行具有60多年悠久历史,是全国首批组建的股份制农村金融机构。当个人及企业提出贷款申请时,授信部工作人员需要对提交的贷款证明材料与法务合同(纸质形式)进行审核与校验,目前年均处理量7万件以上,整个流程工作繁琐耗时较长。达观提供智能贷款审核系统,运用OCR(光学字符识别)、文本抽取及纠错比对技术,大大提升了审批效率提高客户满意度。
审查材料均为影印件,达观将文本语义分析技术和基于上下文的自动纠错技术引入到OCR识别流程中,达到更好的抽取准确率。通过深度学习模型对近百页审核条款及法规进行学习,达到了在合同起草时可进行智能纠错,合同送审后可进行全篇语义理解,实现了不合规内容的快速判别。替代原有手工Excel表记录方式,将智能贷款审核系统与现有的信贷流程实现无缝对接,保持了用户使用习惯的一致性,无需学习新系统新知识。
首次将文本理解技术引入到农村银行贷款审核流程中,7周完成项目立项、实施开发与测试,一个项目的审核周期由7天缩短到2.5天。
浦东新区科经委承担着促进科技创新和产业融合的重大使命,每年有众多企业进行政府 补贴项目的申报工作,申报企业众多。由于涉及的材料多且专业面广,提供材料较多难 免存在虚假、错误数据,人工处理耗时耗力,是一项高强度的工作,达观基于NLP技术帮助科经委构建项目申报信息智能核查系统,辅助人工完成基础性信息审核工作,提高项目申报审核效率,缩短了申报周期。
申请材料均为影印件且质量不高,达观将文本语义分析技术和基于上下文的自动纠错技术结合行业语料库,解决了传统OCR(光学字符识别)识别准确率低问题。利用docker容器弹性架构技术,实现了对多家企业的大量申报材料同时进行批量比对处理,解决了集中申报期间需要借调多名工作人员并行审核的问题。以申报系统中的项目申请表作为基准文件,对关联营业执照、汇算清缴表、贷款合同、还本付息凭证等进行交叉语义比对,进而核实关键数据的准确性,解决了复杂场景识别难的问题。
能够有效识别虚假错误申报信息,实现人工智能辅助项目申报受理业务场景,进而提高审核工作效率,缩短核查周期,为项目合规申报保驾护航。
海尔是世界500强企业,云超市是海尔生态资源平台的重要组成部分,整合海尔资源与外部资源方,实现多方共赢的重要平台。 在联合运营过程中涉及到的各类合同非常多,需要法务部工作人员耗费大量的人力和时间去审核。达观开发的合同智能比对系统代替人工核实合同电子版差异、合同影印件和电子版差异,获得结果后自动填入到云超市系统,大幅提高工作效率,节省大量时间及人力成本。
默认对上传合同与标准合同库中模板进行比对,支持对用户根据审核结果修改后重新上传的合同与前一版本的合同进行比对,将差异化高亮标注显示。在归档环节,对签字盖章合同影印件与电子版合同进行比对,由原来的人工核实每份10分钟降到秒级。在智能比对过程中,利用深度机器学习等技术,实现语义级别的段落交叉比对,避免误报。
利用机器学习智能识别技术,实现计算机替代人工肉眼比对,解决了海尔云超市在运营中的合同比对归档环节的耗时长、人力成本高和风险高等难题。
iCourt是法律职业共同体的最佳学习平台,聚集1000多家律所的管理者。已有10万多名法律人走进iCourt网上法学院,律师在日常工作中需要处理大量合同(包括字、 词、句基础的内容审查和关键条款的审查),达观提供智能合同分析平台助力iCourt打造智能化的律师工作系统,实现合同审核的智能化。
支持上百种不同的合同类型,系统可以根据模型自动判断合同类型,使用与之匹配的模型进行关键信息提取、审核比对,为客户提供全类型合同的智能审核。基于合同种类多且个别类别合同样本少的业务特点,系统采用了深度学习和知识图谱技术,让系统具有优秀的精准泛化能力,对小样本的合同处理做到游刃有余。
助力打造“阿尔法一体化智能办案系统”,利用可视化、大数据和人工智能三大前沿技术,将合同审查专业服务与律所管理和法律大数据一体化管理,创新律师行业工作新模式。将合同审核效率提高至原来的3到5倍。
招商证券托管部和结算部,负责业务结算及合同管控,需要从大量的扫描件合同中抽取 出关键信息录入业务系统,过往要耗费大量的人力成本进行手工摘录,过程中容易出现人为疏漏。为此招商证券引进达观智能审阅系统,运用语义理解技术,对应用条款关键信息进行自动抽取,提升流程效率及准确度。
在客户无法提供标注样本的背景下,利用自身积累的证券行业知识对样本进行了预标注,大幅缩减了客户投入及实施周期。将达观具有自主产权的基于语义理解的OCR技术引入,提升了扫描件结果的准确性,大大超过客户预期。
该系统3周完成部署,短时间内准确率,召回率和F1值接近93%。成熟的自主训练平台使得客户能自行扩展抽取文档种类及字段,大大提升项目应用价值。
深交所每年需审核20余万篇上市公司重组公告,需要对公告中300多个关键字段进行判断分析。人工审阅耗费大量人力财力且效率较低,为更好运用人工智能来解决这一难题,深交所携手达观开展创新合作,将达观在文本处理领域领先的语义理解技术、智能审阅系统引入到审核中,希望大幅度提升审阅的工作效率。
待抽取信息多数处在表格中,表格存在跨页、无框线、多层嵌套等问题,是业界难点。达观结合计算机视觉和自然语言理解技术,对表格结构进行了精准识别和内容正确抽取。单从抽取信息很难对重组业务之间关联度的深浅进行判断,通过引入企业和上市准则等 外部数据,有效处理了类似的需要语义推理的高难度字段。交易标的、交易对手方等存在多个值且有多个子字段,具有层级关系。达观通过细维度 抽取挖掘以及各字段之间对应关系的判断,将凌乱分布的信息进行有效整合。
对上市公司重组公告中关键信息进行了有效抽取,让深交所深度应用自然语言处理技术具备了坚定信心。深交所后续会在智能审核和智能监管等方面与达观展开深度合作。
兴业银行排名全球银行50强,需要近千位对公理财经理将数万份上市公司闲置资金人工筛选出来用于理财,内容包括用于理财的闲置资金金额、受托方及到期日期等。由达观设计的公告自动抽取系统,可获取理财公告中的关键要素,进而生成企业分析报告,用于快速定向发掘潜在客户。
【歧义消解】各家公司闲置资金的理财产品购买公告行文风格不同,文中的关键信息散落无章, “金额”、“产品类型”、“受托方”等在文中多处存在,形成大量干扰。例如多位置出现“金 额”、“利率”等,达观结合上下文语义分析消解歧义,实现抽取的理财产品各字段一一对应。【表格处理】表格格式多样,存在跨页、横竖线分割不均、表头信息不同等技术难题,传统规则处理方法效果差。达观引用图像识别及深度学习技术捕捉到表格边界与内容,将抽取的表格数据采用语义分析合并同类项,按照统一格式报告输出。【全流程自动化处理】完成了信息抽取的智能化和业务流程的自动化,与客户RPA流程打通,实现全生命周期无“黑盒”效应。客户还可以新增不同类型、字段,灵活进行模型的自学习训练。
7周内完成效果验收,提前将AI文本处理能力对接到RPA流程,并用Excel或简报方式发送给对公理财经理,实现及时掌握潜客动态并提高营销精准度的能力。
证监会以监管科技3.0大数据监管平台为基础,引入自然语言处理、机器学习等技术,对全国证券期货市场实施科技监管,保障其合法运行。达观为其提供招股书抽取审核系统,与证监会共同研究并实现金融文档的智能化管理,提高主动发现问题能力和监管智能化水平。
需要抽取的字段大部分在文档的表格中,表格样式多样甚至有一些是无框的,达观基于智能视觉检测技术识别表格样式定位表格,强化表格内容解析,大幅提升整体抽取准确率。分钟级完成2000多个字段抽取以及按照上市规范审核披露信息是否完整准确,构建资本市场的知识体系库,辅助监管科技平台对市场的生产和业务活动进行全方位监控和数据分析。人工标注招股书上千页长篇幅中上千个抽取字段工作量较大,达观数据采取机器智能预标注+人工复检的方式进行语料标注,提供高质量语料,保证了系统抽取和审核精度。
通过对IPO招股书收取和审核,为智能化管理证券期货市场的各类金融文档提供了重要理论和实践依据,为促进金融科技监管模式的创新奠定了基础。
玖坤远程设备监控与诊断系统平台是将网络技术,设备自动化技术以及信息技术进行整合,实现设备的远程监控及诊断。
安全可靠
功能完备
元创岛3D虚拟直播助手集建模、绑定、渲染、算法于一体,同时支持摄像头动捕和动捕设备双重驱动方式,仅需要一个手机+一个普通笔记本即可开播,并支持二次元、写实、超写实3D数字人定制。帮助企业打造更加立体鲜活的IP形象,助力企业积累数字资产,布局元宇宙生态。
一站式集成系统
多种驱动方式
云端渲染模式
数字人形象定制
UiPath为大型机自动化提供API和云。它可通过UI自动化集成任何大型机,如T3700、绿屏、Java和传统应用。