立即咨询

电话咨询

微信咨询

立即试用
商务合作

那些光学字符识别(OCR)的识别小技巧(二)

2022-11-21

 

     随着OCR的越来越普及,越来越多的人开始接触到了OCR,所以今天继续和大家分享一下可视化设计开发中的交互设计的一些经验。

     部分OCR软件无法识别的情况,是要执行的文本是格式化的。如粗体、斜体、第一行缩进等,将丢失格式或出现混乱。如果您有与格式扫描文本提前确保识别软件支持扫描文本格式。使OCR软件主要集中注意力查找自己正确的字符,也可以通过关闭样式识别信息系统,不再顾及字体和字体格式。

     当扫描半透明的身份证件或者其他文件,晦涩的文字字体的文本通过纸背,遇到该类进行扫描,应找出了很大的障碍的原因。只要在一个扫描原稿的背面附,盖一张黑纸,扫描,增加扫描对比度,可以减少模糊字体对背面的影响,提高OCR识别精度。

     一般扫描的文档的文本是黑、白双色文件,但往往扫描模式扫描模式设定灰度时却。特别是在原稿质量管理较差时,使用不同灰度模式通过扫描。并在扫描OCR系统软件处理完后再继续学习识别,这样会得到发展较好的识别正确率。

     值得注意的是,OCR识别软件能够确定自己家门口,几个百分点的阈值差异,可能会影响正常识别。 在进行大规模手稿扫描时,得到的图像进行文件的大小企业会比黑白合同文件大很多。必须对手稿进行测试,以找到最佳的阈值百分比。

     遇到扫描原稿图文混排,首先明确使用的自动识别软件支持此功能的图形分析。如果社会支持自己的话,OCR软件会自动计算出文本的内容、位置和先后发展顺序。在进行分析这类扫描模式识别时,文本部分可根据被识别的正常顺序表示。

     如果要扫描OCR技术印刷产品质量稍微差一些的文章,而且在字体的笔画上也会出现粘连现象,比如说通过报纸,扫描的结果将不会使用黑白分明,会出现需要大量的黑点,这两项可是汉字进行识别的大忌,将严重社会影响汉字可以OCR识别的正确率。 为了获得更好的识别结果,我们必须仔细调整音调,反复扫描,以获得更理想的结果。另外,作为报纸薄,大多数纸张不高,导致扫描仪盖板未完全抑制报纸(间隙),这么好的扫描识别一般的报纸,杂志没有效果的影响。OCR解决管理办法是在报纸上压一至两本16K的杂志,效果研究还是一个不错的。

     最后,我们得出结论,OCR的识别基础是基于多方面的,如果你能清楚地了解懂得这些知识,会对你的工作帮助许多。


版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

热门数字化产品

内训宝企业在线培训系统内训宝企业在线培训系统拥有清晰、流畅、稳定的视频课程播放功能,视频/讲义-键切换的播放模式,满足不限终端、不限地点的学习需求,支持视频课程及PDF、PPT等文本课程学习,视频支持MPEG1、AVI、 FLV、 MPEG4、WMV、RM、QUICKTIME等主流视频格式。深入教育培训场景,体验全新学习形式。全面多终端智能学习及量身定制服务。
精臣云资产固定资产管理系统精臣云资产固定资产管理系统提供全生命周期的资产管理解决方案。它通过云计算和物联网技术,实现资产的实时追踪与管理,支持资产盘点、折旧计算、维修记录等功能。系统特点包括采购管理、资产入库、日常管理、标签打印、资产盘点、耗材管理、单据审批和资产报表等。精臣云资产旨在提升资产管理的透明度和效率,降低管理成本,适用于多种企业场景。
DuoPlus云手机DuoPlus云手机是云端操控,拓展全球商机,简化多设备跨平台社媒操作,专注打造全球社媒营销、Tiktok、WhatsApp专用云手机!
堆雪球 SCRM私域运营管理系统堆雪球科技有限公司,是一家专注微信生态,帮助客户进行风控管理、销售提效、私域运营、自动化营销,致力于让企业营销高效可控,过程更聪明。 堆雪球目前旗下拥有: 客户营销解决方案、私域营销系统、线索导流方案、上下游配套资源。
腾讯Tapd研发项目管理平台TAPD是源自于腾讯的敏捷产品研发协作平台,提供贯穿敏捷开发生命周期的一站式服务。覆盖从产品概念形成、产品规划、需求分析、项目规划和跟踪、质量测试到构建发布、用户反馈跟踪的产品研发全过程,提供了灵活的可定制化应用和强大的集成能力,帮助研发团队有效地管理需求、资源、进度和质量,规范和改进产品研发过程,提高研发效率和产品质量。
为你推荐
查看更多