几种典型光学字符识别(OCR)技术的网络结构(二)

来源: 云巴巴 2022-11-21 15:51:18

 

     随着互联网的成长,各种软件涌入了我们的视线,怎么打光学字符识别(OCR)技术是如何实现图片转文本呢?主要是基于以下几种网络结构。

     一种常见的做法是调整候选锚定框,例如光学字符识别(OCR)技术在faster R-CNN的基础上,将垂直的候选锚定框进行旋转满足非垂直文本的检测,这样一来就可以满足非垂直文字的检测需求。

     光学字符识别(OCR)技术RRPN 的网络结构

     SSD是一个文本框改进算法。调整了发展锚定框的长宽比,以适应中国文字的高长宽比。使用输出层还使用非标准的卷积核,更适应中国文字细长的宽高比这一发展特点。

     光学字符识别(OCR)技术TextBoxes 的网络结构

     DMPNet使用四边形检测到非矩形块候选锚(深度匹配现有网络)。通过OCR Monte-Carlo方法进行计算数据标注不同区域。矩形候选框和旋转产生候选框的重合度后重新设计计算一个顶点位置坐标,得到非矩形四边形的顶点坐标。

     光学字符识别(OCR)技术DMPNet生成候选锚定框的示意图

     另一种方法是通过向顶底的方法,检测所述细粒度连接文本成文本更粗粒度的改进后CTPN是目前我国应用范围最广的文本进行检测系统模型方法之一。一个基本假设是,单个字符比更异构的文本行更容易检测,因此OCR作为首先为单个字符检测类似的R-CNNLSTM后来添加在双向网络检测时,形成的检测结果序列提供文本的上下文特征,它们可以被组合以得到多个文本字符线。

     光学字符识别(OCR)技术CTPN的网络结构

     Seglink的设计灵感来自SSD。方法连接相邻的连接上下文。并且可以通过将连接参数的学习资源整合进了神经系统网络的学习活动过程,使得模型更容易训练。

     光学字符识别(OCR)技术SegLink的网络结构

     一些研究推出注意机制,使用以下评价权重的密集关注模型图像模型。对于文本教学内容较之背景图像有着更高的注意力,OCR这样一个有利于将前景进行图像和背景图像分离,使检测研究结果更准确。

     如今,光学字符识别(OCR)技术还处于初期阶段,设备风险控制任重道远,腾讯光学字符识别(OCR)技术将不断挖掘其丰富其功能,不断打磨自身技术,帮助和辅助人们更好的工作,学习和生活。

     版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

智能文档处理技术揭秘:如何低成本实现高准确率的文档信息抽取?

智能文档处理技术揭秘:如何低成本实现高准确率的文档信息抽取?

智能文档处理IDP是来也科技智能自动化平台的核心能力之一。IDP 基于光学字符识别(OCR)、计算机视觉(CV)、自然语言处理(NLP)、知识图谱(KG)等前沿技术,对各类文档进行识别、分类、抽取、校验等处理,帮助企业实现文档处理工作的智能化和自动化。

2021-12-17 11:29:14

AI时代,我国人工智能发展优劣势分析

AI时代,我国人工智能发展优劣势分析

现在社会人工智能对于大家的生活产生了越来越深刻地影响,随着人工智能的不断更新迭代,同时向日益丰富的应用场景渗透,在如此火热的大背景下,许多不同的创新声音在不断的涌现了出来。有的学者甚至认为,人工智能到今天只是表面繁荣,实际的发展已经陷入困境。

2020-03-16 15:36:00

指纹识别与USBkey的完美结合会给我们生活带来哪些便利

指纹识别与USBkey的完美结合会给我们生活带来哪些便利

指纹USBkey在基于USBkey身份认证的基础上添加了指纹解锁,在我们的日常生活中,USBkey因其小巧便捷成为很多人进行身份认证的首要选择。USBkey身份认证采用软硬件相结合,而指纹USBkey在保持这点的基础上加入了指纹识别,让我们可以更方便的使用

2022-11-23 16:30:20

基于眼科科技多模态生物识别技术的智能民航解决方案

基于眼科科技多模态生物识别技术的智能民航解决方案

眼科技术还将利用"智能民航"发展的东风,积极开展技术产品创新,使旅客出行更加高效、安全、便捷,真正实现"智能"融合。

2022-11-23 16:38:36

智能机器人,赋能酒店变得更加智慧

智能机器人,赋能酒店变得更加智慧

在物联网中,很多地方都会出现在智能机器人的影子,这些人工智能加入到智慧酒店中,创造出更加神奇的效果! 从天猫精灵,小爱同学,小白,小度等这些产品,相信大家已经熟悉,当这些设备会出现在智能酒店,也显示出别样的味道。

2020-04-22 17:34:54

疫情之下,机器人流程自动化(RPA)的助力(一)

疫情之下,机器人流程自动化(RPA)的助力(一)

萨福克县是美国疫情最严重的地区之一:纽约萨福克县是一个利用自动化应对疫情的实例。 在技术服务提供商SVAM的帮助下,于2020年3月部署了UiPathRPA平台。 萨福克郡专员斯科特Mastellon IT部门表示,该系统包括许可多达三个机器人可用,全县

2022-11-22 15:28:39

严选云产品

迪普科技IPS2000入侵防御系统 迪普科技IPS2000入侵防御系统是针对应用系统防护而设计的专业安全设备,为用户操作系统、中间件、数据库、邮件服务器、DNS服务器和FTP服务器等核心资产提供专业的应用层防护。IPS2000入侵防御系统具有全面的特征库、先进的双病毒引擎及专业的四大检测引擎可对层出不穷的漏洞威胁及攻击手段提供全面的防护和加固。
Testin云测深度安全渗透测试 Testin云测深度安全渗透测试模拟黑客常用的漏洞发现技术和攻击手段,深度挖掘安全隐患,提供形式涵盖漏洞风险说明、测试过程详情以及修复方案等信息的专业报告,并协助漏洞整改,从而帮助客户直观的理解并解决系统面临的安全风险,大幅度提高被测对象的安全性。
誉能CTG企税通组件接口解决方案 誉能CTG企税通组件接口解决方案,自动将待开票数据写入开票软件,实现ERP/财务/业务等系统直连快速开票。开票完成后,自动将开票数据回写到ERP/财务/业务等系统,摆脱人工操作,提高开票效率。自动生成税收分类编码/获取证书口令/抄报/上传发票到税局等。
VMware vSphere企业级工作负载平台 VMware vSphere® 是企业级工作负载平台,可将云优势融入本地部署工作负载。vSphere 通过 VMware 云控制台进行集中管理以提高运维效率,并与越来越多的附加混合云服务集成,以加快灾难恢复、勒索软件防护、容量优化和规划等功能。vSphere 提供了一个企业级自助式 Kubernetes 运行时,以及一个简化 Kubernetes集群运维的多云管理平面。
汇联易电子发票差旅报销系统 汇联易利用创新的信息化方式驱动费用管理理念,为滴滴出行、复星集团、三一重工、晶科能源、特步、鄂尔多斯、屈臣氏、安盛天平、维美德等千家知名客户构建出有行业深度和经众多领先企业实践过的费控咨询方法论。
OceanX文件扫描自动撷取系统 OceanX文件扫描自动撷取系统,强大的图形化流程设计工具,自动业务流程,把指定处理内容(如文档,通知或任务)提交至下一个参与人进行查看或审批。通过电子邮件用户知道他们有哪些内容需要查看或批准,简化业务流程,减少时间费用,降低错误率和提高工作效率、流程中的任务信息随时可查可用,无缝整合 OceanX ECM。

甄选10000+数字化产品 为您免费使用

申请试用