一文读懂腾讯OCR文字识别,带你玩转AI世界!

来源: 云巴巴 2024-03-27 10:28:47

在日常生活工作中,我们难免会遇到一些问题,比如自己辛辛苦苦写完的资料,好不容易打印出来却发现源文件丢了;收集了一些名片,却要一个一个地录入信息,很麻烦;快递公司的业务越来越好,但每天需要花费很多时间登记录入运单,效率非常的低。

那么,有没有什么技术能帮助我们解决这些难题呢?有的,那就是OCR文字识别技术。

OCR 是实时高效的定位与识别图片中的所有文字信息,返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别,以及中英文、字母、数字的识别。简单来说,就是将图片上的文字内容,智能识别成为可编辑的文本。

OCR文字识别技术在刚开始出现时备受关注,但随着应用范围扩大,复杂背景、低分辨率、多语言混合等等难点的出现,让文字识别变得越来越困难。

腾讯优图实验室在文本检测技术方进行了深度优化,提出了Compact Inception,通过设计合理的网络结构来提升各尺度的文字检测/提取能力。同时引入RNN多层自适应网络和Refinement结构来提升检测完整性和准确性。

腾讯OCR文字识别基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。

作为国内首家将手写体识别应用在复杂场景下的服务商,腾讯OCR数字识别准确率高达90%以上,单字识别速度在15ms以内,复杂汉字准确率超过80%。

那么它的常见问题到底有哪些?性能、计费又怎么算?数字化顾问小巴解决您的一切疑问,带你轻松玩转AI世界!

icon性能相关

1、文字识别的响应速度是多少?

一般在200ms - 1s内,识别时间会受图片大小、字数多少及网络环境影响。

2、文字识别的并发量是多少?

目前支持的并发量(QPS)在十几次到数十次不等,QPS跟服务本身情况和机器性能有关。通常来说,大部分客户的日常调用是可以满足的,如因为活动等需要拓展 QPS,可以联系我们并告知具体调用量情况。

3、通用文字识别支持的字数和字体大小上限是多少?

通用文字识别目前没有字数和字体大小限制。在图片高度1000px的条件下,单行字高48px左右效果比较好。

4、文字识别对上传的图片格式和图片大小有哪些要求?

图片格式:支持 JPG、JPEG、PNG、BMP 等常规图片,不支持 GIF 类型的动图。

图片大小:不同的功能接口,对于图片大小的要求都不同。

5、如何提高文字识别的准确性?

文字识别的准确性跟字体、拍照光线、清晰度等因素有关,建议图片文字清晰,光线自然无反光。

调用身份证识别时,建议身份证占图片比例应超过80%。

icon功能相关

1、通用印刷体识别支持识别哪些语言?

通用印刷体识别目前支持中文简体、繁体和英语、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。

2、文字识别返回的文字类型和存储方式是什么?

识别出来后返回的是 JSON 字符串,您可以自行选择存储的方式。

3、身份证识别支持识别中国香港和中国台湾的身份证吗?

身份证识别目前只支持识别中国内地(大陆)的居民身份证。

4、身份证识别支持核验身份证信息有效性吗?

身份证识别仅支持识别身份证正反面字段,具备翻拍、PS、复印件告警功能。您可以使用人脸核身的身份信息认证接口,用于校验姓名和身份证号的真实性和一致性。

5、调用身份证识别接口时,为何返回的识别内容与实际身份证信息不符?

请使用未PS处理的身份证图片。身份证图片会转换成 base64 格式,如果您的身份证图片经过 PS 处理,最终识别的还是身份证原图。

6、通用印刷体识别能否支持古籍的内容?

不支持。因为古籍是从右到左、从上到下的阅读书写方式;而文字识别是从左到右、一行一行的识别方式,文字识别不支持更改识别顺序。

7、是否可以识别电子账单/商品吊牌数字/运动 App 的步数/商超货架商品信息等?

可以。您可以使用通用印刷体识别、通用印刷体识别(高精度版),准确率一般在93% 以上,不过根据使用场景的不同,准确率也有所差异。

8、是否可以识别银行汇票/保险单/手写的发票/个人征信报告?

可以。您可以使用通用印刷体和通用手写体识别,如需要定制化开发,请联系小巴告知具体的使用场景和需求。

9、文字识别支持移动端离线操作吗?

文字识别目前不支持移动端离线操作。

10、文字识别支持私有化部署吗?

支持,请联系小巴告知具体的使用场景和需求。

11、文字识别是否可以批量识别吗?

文字识别只支持单张识别。

icon计费相关

1、身份证 OCR 是如何收费的?

按调用接口次数收费,如身份证的正反面各识别1次,则计费2次,具体价格请可以咨询我们。

2、预付费资源包买错了可以退款吗?

若预付费资源包购买后未使用,支持7天内(含7天)无理由全额退款。

3、免费资源包用完以后能否自动停服?

当您不再需要OCR服务,您可以在控制台设置页关闭文字识别服务,需在付费资源包耗尽后才可关闭成功。关闭成功后,相关 API 和 SDK 将不能成功调用(智能扫码 SDK 除外),除非重新开启或者重新购买资源包。

4、免费资源包用完以后将怎么收费?

免费资源包耗尽后,如果您已购买预付费资源包,则自动转入预付费资源包进行扣减。如果您未购买预付费资源包或者预付费资源包已耗尽,服务将面临不可用风险,为保证服务不受影响,可以购买预付费资源包或开通付费模式。

5、我购买了通用印刷体识别资源包,通用印刷体识别(高速版)、通用印刷体识别(高精度版)接口都可以用吗?

不可以。通用印刷体识别、通用印刷体识别(高速版)、通用印刷体识别(高精度版)属于三个完全不同的接口,不同接口的资源包不支持混用。如果购买的资源包是通用印刷体识别,只能给通用印刷体识别接口使用。

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

目前而言生物识别存在的缺点有哪些(一)

目前而言生物识别存在的缺点有哪些(一)

生物识别可能没有我们想象的那么好,它也存在着许多的相关缺点。 大多数人认为中国生物技术特征进行识别非常准确,是因为广而告之,你的指纹、虹膜、视网膜、掌纹独一无二,其他人都没有。“虽然这种说法可能是现实的,但生物特征属性的存储远非如此生物识别因子较不详细的

2022-11-22 16:03:46

来了解下光学字符识别OCR技术的应用

来了解下光学字符识别OCR技术的应用

每一项新事物的出现都有其原因,光学字符识别技术OCR当然也不例外。 现在的工作,大多在档案数字化工作中,光学字符识别技术OCR实现了全文字识别的档案扫描工作,便于档案数字化建设。 光学字符识别技术OCR的识别速度较快,但需要进行前期的预处理和后期的人工

2022-11-22 16:05:03

RPA技术突破难关,再次提升企业价值空间

RPA技术突破难关,再次提升企业价值空间

近几年,全球数字化和行业重组不断挤压,中国传统商业发展环境发生变化之快前所未有。各行各业都面临能效挑战,竞争市场优势变得愈加脆弱,更加需要安全敏捷的工具去发掘稍纵即逝的新价值网络空间。

2020-03-19 16:13:04

虹膜识别技术,给予我们全天安全的保护

虹膜识别技术,给予我们全天安全的保护

虹膜识别技术在生物识别技术中被我们广泛应用在越来越多的场景中,在很多对于安全系数以及身份认证时的准确率等方面虹膜识别技术有着广泛的应用。对于我们每个人的生活而言虹膜识别技术从最初并不被我们所了解再到如今被我们使用在越来越多的场景中,通过虹膜识别技术或许也能

2022-11-24 10:54:46

启智模块机器人 | 四轮底盘灰度传感器循迹实验

启智模块机器人 | 四轮底盘灰度传感器循迹实验

启智模块机器人是一款侧重机器人底层硬件教学的模块化套件,采用免螺丝的独特装配方式,缩短装配手工时间,学习的重点集中于结构设计、程序编写和功能实现上。在有限的实验课时里快速体验和学习各种机器人构型的优缺点和控制特性,为将来深入学习机器人学打好坚实基础。

2020-03-30 10:02:01

24年风雨兼程终迎圆满结局,人脸识别技术扮演了什么角色?

24年风雨兼程终迎圆满结局,人脸识别技术扮演了什么角色?

腾讯云顶级AI实验室,聚焦计算机视觉研究与落地,领先于国际水平的人脸识别技术为现实场景中的应用提供了保障。通过与警方的密切合作,不断迭代人脸检索技术,增强人脸识别能力,协助警方在海量的人脸数据中快速对比、锁定、匹配出可能的失踪人口。

2022-11-24 14:15:25

严选云产品

U盘加密系统【UES】 U盘加密系统针对当前各类组织机构核心外带数据安全需求而自主研发的一款保障信息资产安全的产品,只需外带一个安装U盘加密系统的U盘介质,即可完成对文档加解密处理以及数据防泄漏保护的解决方案。
数族科技企业智能税控平台 数族科技企业智能税控平台企业全电数字证书集中化开票管理。一个平台支持所有企业数电发票开具和管理。税盘集中开票管理易用准确高效。多元化产品体系,满足多层次『税务信息化」需求。
腾讯云物业行业数据可视化分析平台 腾讯云物业行业数据可视化分析平台以总部视角,从集团概览、招采管理、财务管理、人事管理等领域对全集团进行统筹管理,实现集团领导指挥决策及汇报演示的提质增效。以月度为单位来通报每个区域工单处理情况(工单量、响应率、关闭率、满意度评价、预警);智能收费收费率和占比、公众号的关注率、企业微信绑定率,日常收缴率报表等。
网御星云视频安全接入系统 视频安全接入系统是一款以视频协议解析和安全认证技术为基础,来实现跨安全域多媒体数据交换的网络边界安全产品。适用于公安、政府企事业等需要跨安全域实现视频图像传输的应用场景。产品由接入认证服务器、安全隔离设备和视频用户认证服务器组成。产品严格按照公安相关规范设计具有安全性、合规性特点。
博睿宏远链路全景图 通过博睿宏远布局全国的IDC骨干节点,对互联网主干链路进行不间断监控,对全国骨干网络各个链路之间的数据连通性进行全景呈现,帮助客户全面掌握主干链路整体运行情况。
内网终端安全管理 天珣内网安全风险管理与审计系统,是启明星辰依据在终端安全管理和建设相关领域多年的实践经验,自主研发的业界领先的内网安全管理产品。天珣提供了完整的传统桌面管理,终端数据防泄露,终端防病毒一体化解决方案,满足客户的行业合规需求,全面解决终端安全问题。

甄选10000+数字化产品 为您免费使用

申请试用