文本识别在光学字符识别(OCR)技术中的地位

来源: 云巴巴 2022-11-21 15:51:36

 

     从管理者到教师,从家长到学生,每个工作在各个环节都要与文档打交道,而光学字符识别(OCR)技术可有效把图片上,或者是PDF格式的文字内容智能识别成为可编辑的文本,正在新的时代为更多行业创造着独特全新的价值。

     OCR文本识别

     OCR文本识别在传统技术中采用模板匹配的方式方法进行分类,但是,对于文本行,它只能从文本的最后行通过识别每个字符的内容来确定。因此我们可以对文字行进行一个字符切分,以得到提高单个文字。这样,超切-动态规划是最常见的分割方法。

     由于OCR技术在多个单个字符识别结果可能由于切割位置,例如,“诸如”出现的单词是不切割期间的时间被分割为“M _嘴”,所以需要进行过分割候选字符,它在足以粉碎,接着动态编程合并分割成芯片,以获得最佳的组合,该方法需要人工设计损失函数。

     还有另一种OCR方法是通过使用滑动窗口对每一个可能的字符数据进行分析匹配,如果滑动窗尺寸过大会制度造成企业信息系统丢失,这种方法的准确率依赖于滑动窗口的滑动窗尺寸,而太小则会使计算力需求得到大幅增加。

     通过OCR技术识别每个单个字符来实现识别文本的上述传统方法中,该过程导致的上下文信息的损失的单个字符具有高的识别精度,这是由一个条目确定难以保证精度。以身份证识别为例,即使单字符进行识别方法正确率可以高达99%,OCR识别18位的身份号的场景下,其条目平均正确率只能到0.9918=83%,如果一个切分也存在1%的损失(即正确率99%),条目以及正确率则只有(0.99*0.9918=70%。

     因此,引入上下文信息已成为提高条目准确性的关键。从学习的深度的观点出发,被引入的序列信息这样的上下文中,RNN LSTM等依赖于神经网络的定时关系是最好的选择。

     所以当初为了研究汉字 OCR 识别,开发者实验了 N 种算法——要么是识别效果不好,要么是识别太慢,要么是样本库太大——最后选择的是一种接近深度学习的多层神经网络算法,终于实现了相对满意的汉字识别效果。

     以上就是光学字符识别(OCR)技术的相关内容,光学字符识别(OCR)技术的核心是文本识别,通过文本识别可以进行有效分类。也欢迎你了解更多关于光学字符识别(OCR)技术的知识。

     版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

虹膜识别有哪些常用的应用场景?

虹膜识别有哪些常用的应用场景?

是人工智能技术生物识别中的一种。应用于安防设备(如门禁等)中的一种基于眼睛中的虹膜进行身份识别的技术,有高度保密需求的场所常应用。

2022-11-23 15:56:41

腾讯云618活动,人脸核身1000次身份核验低至920元!

腾讯云618活动,人脸核身1000次身份核验低至920元!

腾讯云618活动为用户准备多重惊喜好礼!不仅有腾讯云618代金券,更多腾讯云618优惠活动欢迎咨询云巴巴严选云!

2022-11-24 13:57:53

面部图像识别技术的应用都有哪些

面部图像识别技术的应用都有哪些

在本文章中,主要谈论下面部图像识别技术在面容 ID、移动平台和社会化媒体的应用。 社交媒体平台采用了面部识别算法来丰富其功能,以便在激烈竞争中吸引更广泛的用户群。 应用程序允许通过一个特殊的过滤器与其他人进行视频聊天,这个过滤器可以修改用户的面部表情。虽

2022-11-22 16:13:29

多传感器信息融合技术在机器人中的应用

多传感器信息融合技术在机器人中的应用

一项新型技术,可以话腐朽为神奇。而对于智能机器人来说,多传感器信息融合技术就是这样的存在,本篇文章,就赶快和小编一起来看看多传感器信息融合技术在机器人中的应用吧。 机器人的多传感器信息融合技术是一个非常活跃的研究领域,主要研究方向有: 多级传感器融合,

2022-11-22 09:48:00

人工智能中的硬件和软件

人工智能中的硬件和软件

机器学习将如何演变为人工智能,在硬件和软件方面需要积累经验,那么软件硬件是什么呢?

2020-03-17 17:08:04

疫情期间减少外出的我们通过人脸核身技术就能办理业务

疫情期间减少外出的我们通过人脸核身技术就能办理业务

人脸核身技术对于我们的生活而言或许最大的改变或许就是将只能在线下办理的相关业务成功的转移到了我们每个人的手机上,而通过人脸核身技术也让我们每个人的手机中都有一个“办事大厅”。

2022-11-24 13:52:06

严选云产品

云客教育一体化解决方案 云客教育一体化解决方案,掌握每一次销售与客户在微信沟通内容,避免销售人员飞单、响应不及时、消极怠工、转化率低,精准复制成功经验,系统提升销售成功率。 自动录音并保存,有效提高沟通质量,沟通结束标记跟进情况,无需重复录入。朋友圈式展现销售动态,实时掌握工作进展。
声网Agora小班课实时互动直播解决方案 声网Agora小班课实时互动直播解决方案,低延时、强同步音视频互动教学体验,丰富、可靠、稳定的课堂消息互动,30+白板工具,支持多种动态课件展示,丰富课堂录制方案,百亿分钟稳定录制服务验证。
数商云瓴犀S2B2C供应链系统 数商云瓴犀S2B2C供应链系统,深度融入生产资料流通、生产制造流通、成品分销流通环节,深度赋能产业链。支持市场中常见的多种电商平台模式,可根据市场反应灵活变换/叠加运营逻辑规律。支持自营、招商入驻复合平台运营方式,多商城运营管理, 满足多场景应用。
百度智能云智能洗煤厂解决方案 百度智能云智能洗煤厂解决方案,从连接、应用、运营层,包括主备型核心网、WiFi接入网关、分流网关、融合通信、专网管理系统,提供5G与WiFi统一管理、融合通信、本地化运维能力,满足行业客户多层次专网需求。百度边缘云提供和中心云一致的功能和体验,让应用不再受限于基础设施物理环境。
物联网SIM卡 三大运营商物联网卡资源全覆盖,提供双切卡、三切卡、贴片卡和NB卡等卡体,全方位满足您的应用需求。
腾讯T-Sec 主机安全 基于腾讯安全积累的海量威胁数据,利用机器学习为用户提供黑客入侵检测和漏洞风险预警等安全防护服务。腾讯金牌代理云巴巴提供一站式网络云安全产品选型和技术支持,拥有比官网更低的折扣和更完善的服务。

甄选10000+数字化产品 为您免费使用

申请试用