几种典型光学字符识别(OCR)技术的网络结构(一)

来源: 云巴巴 2022-11-21 15:48:22

 

    提到验证码大家都不陌生吧,而数字验证码相较于光学字符识别(OCR技术并不难,只是 0-9 十个数字,加上轻微的旋转扭曲缩放即可。如果有粘连需要被分割的字符,它可以用来计算Viterbi算法的最大联合概率。

    但是汉字跟验证码进行不同,汉字很复杂,并且企业数量存在很多。常用汉字就 3000 多,再加上通过旋转扭曲缩放,样本公司数量也是非常具有恐怖。怎样把一大坨汉字作为样本塞进应用包里面是一个煞费苦心的事情。现在就介绍几种典型光学字符识别(OCR)技术的网络结构。

    通常的做法是使用CRNN模型。以CNN特征可以作为一个输入,双向LSTM进行数据序列分析处理技术使得文字识别的效率大幅提升, 首先通过OCR技术的分类方法得到特征映射,也提升了模型的泛化能力。然后通过结果的CTC平移得到输出结果。

    CRNN OCR的网络结构

    另一种方法是以CNN特征可以作为一个输入,引入关注的机制。通过注意力进行模型对RNN的状态和上一状态的注意力权重分析计算发展出新一状态的注意力权重。特征和权重输入RNN,结果的CNN后由编码和解码获得。

    端到端的OCR

    与检测识别的多级OCR不同,将文本检测和识别统一到同一个工作流中,深度学习使端到端的OCR成为可能。一种目前已相对称FOTS(快速的面向text识别)关注端到端的框架。FOTS的检测工作任务和识别主要任务信息共享卷积特征图。其中,检测一方面卷积,另一方面它引入RoIRotate,一种操作者的用于提取指向文本区域。得到一个文本候选区域特征后,将其作为输入到RNN编码器和CTC解码器中进行风险识别。 同时,OCR端到端网络培训是可能的,因为所有的运营商都是可微的。由于简化的工作流程中,网络可以在低运营成本进行验证,以实现实时的速度。

    总结

    尽管基于深度合作学习的光学字符识别(OCR)技术主要表现相较于传统教学方法可以更为出色,但是通过深度学习科学技术发展仍需要在光学字符识别(OCR)技术研究领域方面进行特化,而其中的关键正式传统光学字符识别(OCR)技术管理方法的精髓。

    因此,我们仍然需要从传统方法的经验中学习,所以学习和深度的组合还提高OCR的性能。另一方面,作为一个深度合作的推动力,因此可以收集广泛而优质的数据分析也是我国现阶段光学字符识别(OCR)技术产品性能的重要举措之一,数据起到了发展至关重要的作用。

    版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

人工智能技术给我们带来了什么呢?

人工智能技术给我们带来了什么呢?

计算机科学将人工智能研究定义为对“智能代理”的研究:任何感知其环境并采取最优行动使其有机会成功实现目标的设备。 一个更详细的定义将人工智能描述为“一个可以正确解释外部数据,从这些数据中,并利用这些通过灵活的适应提升实现特定目标和任务的能力的系统。而本文,想

2022-11-22 16:07:47

虹膜识别技术,眼看万千世界,识别天下万物

虹膜识别技术,眼看万千世界,识别天下万物

虹膜识别的技术与发展让我们的双眼在更多领域都有很大的发展空间,安全和识别速度是我们选择一种识别方式进行核验的主要选择。在我们的日常生活中虹膜作为我们日常生活中最重要的一个器官,让我们看到万千世界,感受到世界时时刻刻带给我们惊喜。虹膜识别作为基于我们每个人虹

2022-11-23 16:42:26

疫情之下,机器人流程自动化(RPA)的助力(一)

疫情之下,机器人流程自动化(RPA)的助力(一)

萨福克县是美国疫情最严重的地区之一:纽约萨福克县是一个利用自动化应对疫情的实例。 在技术服务提供商SVAM的帮助下,于2020年3月部署了UiPathRPA平台。 萨福克郡专员斯科特Mastellon IT部门表示,该系统包括许可多达三个机器人可用,全县

2022-11-22 15:28:39

RPA与AI技术的结合会给我们生活带来哪些改变

RPA与AI技术的结合会给我们生活带来哪些改变

随着人工成本的越来越高,很多企业选择在一些流水线岗位上采用机器人代替人工的方式进行工作。RPA,机器人流程自动化这一名词开始被越来越多人所熟知。RPA的不断发展让我们的生活更加便利,同时也会减少企业的人工成本,并且大幅度的提升工作效率。

2022-11-23 16:31:28

关于虚拟文件系统的相关知识简单介绍

关于虚拟文件系统的相关知识简单介绍

多了解互联网知识对我们没有坏处,今天,我就来介绍一下关于虚拟文件系统的相关知识。 在Linux中,虚拟文件系统交换趋向于确定存储的需求,虚拟文件系统提供了一种方法,用于在主机支持多个并发文件系统,如国际组织用于CD-ROM的标准化[ISO]9660切换,

2022-11-21 11:05:37

腾讯云618特惠人工智能专区,仅需十几元带你玩转人脸特效!

腾讯云618特惠人工智能专区,仅需十几元带你玩转人脸特效!

人脸识别是AI视觉人脸系列云产品的基础,只有先进行了完善的识别之后才可以对人脸进行分析,并做后续的检验或变换的操作。腾讯云618特惠活动主推人员库管理,五官定位,人脸检测与分析,人脸验证,人脸比对,人脸搜索,人脸静态活体检测7大人脸识别功能产品。

2022-11-24 14:08:32

严选云产品

八九点班组云企业管理学习平台 八九点班组云企业管理学习平台全力为一线管理者与班组员工打造的企业管理学习平台以智能化、数字化、服务化为基础的学习赋能平台,以了解、培养、管理、引领、 成就为一体的陪伴式学习平台,实现为员工赋能,为组织赋能,为企业赋能。
悬镜灵脉IAST灰盒安全测试平台 灵脉IAST是全球首个基于代码疫苗技术实现应用安全透明众测的交互式应用安全测试平台,通过全场景流量分析技术,如运行时应用插桩(含主动及被动)、启发式爬虫、代理/VPN及流量管家等和原创AI渗透启发技术,在不改变现有IT流程的情况下,赋能开发测试人员,在完成应用功能测试的同时自动化实现业务代码上线前的深度安全测试,重点覆盖90%以上的中高危漏洞,防止应用带病上线, 保障软件供应链开发环节的安全运行。
华为云应用软件开发平台DevCloud 华为云DevOps产品——DevCloud,华为研发工程能力的集中外溢,华为持续投入研发,打造了领先的研发工具链和工程能力,实现业务“6个1”,稳定、安全、高并发,华为1100亿行代码托管和并发,多维度保证代码安全,自主研发的代码静态检查与修复能力,智能代码分析。
云道智造工业仿真APP商店Simapps 云道智造通过构筑互联网时代的工业APP商店Simapps,汇聚海量仿真APP,为各行各业的用户提供仿真支持,为广大仿真工程师提供仿真APP发布与共享平台。
飞企互联智慧物业解决方案 飞企互联智慧物业解决方案,提供统一门户入口,根据架构角色,区分业务范围,打造多组织、多园区、多业态统一的智慧园区运营管理平台。以组件等形式的低代码开发技术手段,赋能园区多业态的生态融合,提供共享复用能力,持续帮助园区数字化运营,持续让用户获得最好体验。
Zilliz Cloud企业级向量数据库平台 Zilliz Cloud 为您提供企业版向量数据库引擎,软硬件双重优化,将性能打磨至极致。向量搜索速度是同类产品的 10 倍以上,大幅降低基础设施成本。采用云原生分布式向量数据库架构,可稳定支持百亿规模向量数据。支持水平扩展和垂直扩展,支持多副本,支持性能的线性扩展。

甄选10000+数字化产品 为您免费使用

申请试用