那些光学字符识别(OCR)的识别小技巧(二)

来源: 云巴巴 2022-11-21 15:49:12

 

     随着OCR的越来越普及,越来越多的人开始接触到了OCR,所以今天继续和大家分享一下可视化设计开发中的交互设计的一些经验。

     部分OCR软件无法识别的情况,是要执行的文本是格式化的。如粗体、斜体、第一行缩进等,将丢失格式或出现混乱。如果您有与格式扫描文本提前确保识别软件支持扫描文本格式。使OCR软件主要集中注意力查找自己正确的字符,也可以通过关闭样式识别信息系统,不再顾及字体和字体格式。

     当扫描半透明的身份证件或者其他文件,晦涩的文字字体的文本通过纸背,遇到该类进行扫描,应找出了很大的障碍的原因。只要在一个扫描原稿的背面附,盖一张黑纸,扫描,增加扫描对比度,可以减少模糊字体对背面的影响,提高OCR识别精度。

     一般扫描的文档的文本是黑、白双色文件,但往往扫描模式扫描模式设定灰度时却。特别是在原稿质量管理较差时,使用不同灰度模式通过扫描。并在扫描OCR系统软件处理完后再继续学习识别,这样会得到发展较好的识别正确率。

     值得注意的是,OCR识别软件能够确定自己家门口,几个百分点的阈值差异,可能会影响正常识别。 在进行大规模手稿扫描时,得到的图像进行文件的大小企业会比黑白合同文件大很多。必须对手稿进行测试,以找到最佳的阈值百分比。

     遇到扫描原稿图文混排,首先明确使用的自动识别软件支持此功能的图形分析。如果社会支持自己的话,OCR软件会自动计算出文本的内容、位置和先后发展顺序。在进行分析这类扫描模式识别时,文本部分可根据被识别的正常顺序表示。

     如果要扫描OCR技术印刷产品质量稍微差一些的文章,而且在字体的笔画上也会出现粘连现象,比如说通过报纸,扫描的结果将不会使用黑白分明,会出现需要大量的黑点,这两项可是汉字进行识别的大忌,将严重社会影响汉字可以OCR识别的正确率。 为了获得更好的识别结果,我们必须仔细调整音调,反复扫描,以获得更理想的结果。另外,作为报纸薄,大多数纸张不高,导致扫描仪盖板未完全抑制报纸(间隙),这么好的扫描识别一般的报纸,杂志没有效果的影响。OCR解决管理办法是在报纸上压一至两本16K的杂志,效果研究还是一个不错的。

     最后,我们得出结论,OCR的识别基础是基于多方面的,如果你能清楚地了解懂得这些知识,会对你的工作帮助许多。


版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

光学字符识别(OCR)是如何进行文字检测

光学字符识别(OCR)是如何进行文字检测

近年来,我们的生活和工作与网络之间的关系越来越密切了。现在,人们的版权意识也变得越来来越强了。这是好事,但是当我们急切的想改一下自己的PDF格式文件时,就要用到本文要介绍的主角了光学字符识别(OCR)技术。

2022-11-21 15:51:27

从智慧停车到数字场景,易知微数字孪生缓解停车难

从智慧停车到数字场景,易知微数字孪生缓解停车难

随着管理手段的数字化、平台化、智能化,停车运营的外延和内涵都有了更广阔的定义,无论是服务内容还是运营方式,都发生了翻天覆地的改变。

2024-03-27 10:44:14

自动化会是人工智能的最终发展方向吗?

自动化会是人工智能的最终发展方向吗?

机器人流程自动化(RPA)被宣传是一种处理与标准工作流程相关的任务,使其完全实现自动化。并减轻工作人员繁琐的人工处理流程(例如费用报告、发票创建、与人力资源相关的任务、呼叫中心操作)的一种方式。

2020-03-16 17:18:49

眼神科技统一身份认证平台,凭一张“脸”也能走天下

眼神科技统一身份认证平台,凭一张“脸”也能走天下

眼神科技在提升民航领域生物识别的安全性、创新性、用户体验性上都扮演了不可或缺的角色,助力民航“One ID”项目高效稳健推进,让我们坐飞机的同时也充分体验到科技带给我们的便利,为我们的出行路上再添一盏明灯。

2022-11-23 16:33:09

“新基建”与建筑的能源管理,这才是智慧建筑该有的样子!

“新基建”与建筑的能源管理,这才是智慧建筑该有的样子!

腾讯智慧建筑AI能效利用物联网、大数据、人工智能技术,结合能源领域资深专家行业经验,优化建筑能源系统运行参数。在保障建筑室内环境健康舒适的前提下,提高设备的运行效率,降低能源系统的能源费用及运维成本。

2024-03-27 14:00:14

一篇关于“AIOps”蓝鲸智能运维的思考文章

一篇关于“AIOps”蓝鲸智能运维的思考文章

矛盾是事物发展的源泉和动力。只有不断的解决问题才能够不断地自我提升,运维中的矛盾,既有来自业务和技术上的,也有来自开发和运营的,而想要解决这些问题只能不断的向前发展。

2020-03-06 17:28:35

严选云产品

e签宝 e签宝从身份认证数据源、证书核验、可信时间戳、私钥保存位置等多个关键点入手提供技术保障,同时从实名认证、意愿认证、签名、存证等环节提供可靠签署流程,证据实时上链,免除平台客户自证清白的成本,也为用户提供放心的签署服务。
古河云科技孪生可视构建系统 古河云科技孪生可视构建系统是基于真实地理信息,集合物理世界各种要素,通过计算机实时渲染生成的可交互三维仿真场景,实现物理世界对象在数据世界中完成精准映射、真实重现, 可以广泛应用于需要场景数字孪生的全行业领域,是一切与场景有关的数字孪生应用的基础。
数说雷达品牌资产管理解决方案 数说雷达品牌资产管理解决方案,按行业构建数据,满足各个品类场景的数据快速查询,行业品牌动态追踪、概念趋势先知,更全面洞察市场新动向。一站式KPI看板,管理层的驾驶舱,品牌监测辅助企业进行快速、完整、准确地品牌分析、策略优化。
百度智能云大模型智能客服解决方案 百度智能云大模型智能客服解决方案,UNIT+大模型生产组件,可用于客服助手,也可用于机器人。提升构建过程的效能,显著提升用户体验效果。提供训练调优、人工干预、运营工具等,实现数据&效果飞轮。大模型语义理解,升级计划,全面升级跨时代产品。
IP数据云一站式风险防控解决方案 IP数据云一站式风险防控解决方案可根据IP代理状态、欺诈行为、风险行为分析得出的标签,再通过分析归属地、网络类型、代理、秒拨,以及业务沉淀的风险标签,有效识别在特定的业务场景中的垃圾注册、刷单、薅羊毛、爬虫、垃圾短信等风险。实时判定IP状态,采用打分机制,量化风险值,精准识别各类恶意IP资源
帆软工程建筑企业数字化解决方案 帆软工程建筑企业数字化解决方案通过业务流程在线化,把手机端、二维码、 物联网等数据连通,大幅度提升一线人员与供应商、分包商的工作效率 。将行业标准、制度规范、管理流程等业务经验预装在软件内部,从而指导业务人员进行专业化工作 。将对工程项目管理有价值的企业内部数据资料与互联网上的商业资讯结合,形成企业信息共享中心。

甄选10000+数字化产品 为您免费使用

申请试用