实现对于待发布文本进行智能化校对,包含但不局限于:
OCR是电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式。
为解决多种文件格式的需求,系统将通过OCR技术处理PDF及图片文件,读取文件中的文本信息,随后对文本信息进行清洗,整理,分析等工作。
基于多任务 Multitask深度学习技术开发的识别算法,采用一种全新 的DeepOCR 识别流程,将自然场景下图片的数据信息进行智能检测,该流程将识别步骤简化到只有3个主要步骤:检测、识别、后处理。
知识图谱(Knowledge Graph)旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或
关系构成。
本公司专注于行业内专业知识图谱的构建与融合,通过强大的自然语言理解和知识挖掘能力,自动进行文本解析和知识抽取、自动构建知识图谱。
通过知识图谱的构建,帮助企业完成了从个体知识向组织知识的转移,企业对个体的依赖度明显降低。结合NLP,机器学习等技术,将知识运用到实际生成
中,释放知识生产力,助力企业加固竞争内核。
机器学习是人工智能的一个重要分支,随着硬件算力的不断提升,大规模数据样本的不断累积,基于深度神经网络的机器学习已经成为人工智能各个领域内应用的首选。
通过长期的技术沉淀,旭易通已经掌握机器学习的核心技术且处于国内领先地位,可根据不同业务场景需求,创建深度神经网络模型,并应用于文本分类,文本纠错,文本生成等下游推理任务。
由于行业知识的壁垒,以及专业数据难以收集,机器学习在企业内的应用难以落地,旭易通与国内大型企业合作,选择企业内使用最频繁,样本数量最大的文本作为突破口,结合领先的神经网络模型,使得机器学习在企业经营生产中发挥了巨大作用。
校对工作是政府、高校、媒体、企业、科研机构等在写作的修改、起草、抄写、排版过程中纠正错误必不可少的环节。而校对软件是公文发布、书籍出版、各类报告、文章编辑过程里的一个必须工序。校对软件的定位不是替代校对人员的工作岗位,恰恰相反,校对软件是文字校对工作人员的助手,提高效率,减轻负担。
当前市场上的相关产品主要以海量词库为基础对文本进行校对,存在很多弊端,如无法以上下文为依据对语义进行判断,无法灵活的适应用户专有词库等。随着近年来基于深度神经网络及机器学习技术的人工智能日渐成熟,强大,使用人工智能执行文本校对任务的需求日益明显,文本校对软件也成为了自然语言处理(NLP)应用的重要方向之一。我公司充分利用在人工智能方面的技术积累,在文本校对、文本摘要等领域进行了持续实践探索,开发了文通校对等辅助系统,全面助力企业文本工作。