立即咨询

电话咨询

微信咨询

立即试用
商务合作

腾讯云TI-OCR训练平台

腾讯云TI-OCR训练平台,单模型支持多种类型任务,任务间能力互补。结构化指标更优,支持自然场景。优化文字纹理细节处理,支持布局、文字等多类模态信息输出。结构化&阅读理解,基于检索的知识库问答,支持信息抽取、文本摘要,具备较强的理解能力,应用于腾讯云官网封闭式问答场景中,阅读理解准确率大幅提升。
立即咨询
icon传统 OCR 深度学习模型icon
iconOCR 大模型icon
iconOCR 大模型的特点icon
iconOCR 大模型适用场景 -- 票据识别icon

识别票据单据、证书执照等:手写体难识别、套打/印章/水印干扰等痛点,票单据自动录入业务下自动识别汇票、回单等结构化信息,银行开户场景、保险审核场景下的用户证照识别较验,物流运送场景下中英文运单关键信息提取。

iconOCR 大模型适用场景 - 表格识别icon

识别表格:表格结构复杂、栅栏线/套打/印章/水印干扰等痛点,金融银行场景下的账户流水、申请登记表等,理赔场景下的申请资料单等。

iconOCR 大模型适用场景 - 文档识别icon

识别文档:文本段落较长、待提取内容存在跨行跨页、需对文档内容进行理解等痛点,各场景类型的合同文件等,商户入驻场景下的承诺函首页等。

iconOCR 大模型适用场景 -- 自然场景识别icon

识别自然场景图片:拍摄背景复杂、拍摄文字扭曲等检测识别业界难点,企业入驻审核场景下的门头照识别、水印公司信息识别,工业质检场景下的电线规格、铭牌信息、零部件规格说明书等,物流快递领域下的集装箱规格、电子显示屏读数等。

icon腾讯云 OCR 大模型家族icon
iconDocLM--端到端文档图像理解icon

图像到文字直接生成,内容感知和具体任务解耦。单模型 & 多任务:单模型支持多种类型任务,任务间能力互补。效果更好 & 场景泛化:结构化指标更优,支持自然场景。数据 & 推理成本低:与多阶段结构化方案持平。

iconDocLM 核心技术icon
自研大容量视觉模型--深入文字感知
优化文字纹理细节处理
应对低质量、套打等难解问题
视觉显著区域提取技术
高效提取问题相关的视觉显著信息
解决大模型序列长度和信息干扰难题
多模态内容解码策略
支持布局、文字等多类模态信息输出
适用于多类任务场景
iconDocLM模型效果icon

全新自研端到端算法方案,单模型支持多种类型任务,任务间能力互补。支持自然场景结构化〔曲文、电表度数读取、门头提取、线缆规格提取等〕。支持指定形式的输出〔排版、仅输出手写等),支持套打/印章/水印等干扰场景信息提取。

模型指标优势
常规KV结构化:大模型召回率相比旧版算法提升3%+
自然场景结构化:大模型召回率预计达95%+〔人眼可识别部分〕
长文类信息提取:大模型召回率预计达90%+
套打场景信息提取:大模型召回率预计达90%+
iconDocQA--阅读理解问答icon

阅读理解任务能力同步提升:结构化&阅读理解,基于检索的知识库问答

iconDocQA 核心技术icon

支持长文档问答:通过Embedding模型将文档向量化成知识库,将问题向量与知识库向量匹配结果送入LLT;文档自监督预训练:增加Пext Token Prediction自监督任务,提升文本表征能力;指令微调:在不破坏LL原有特性的条件下引导模型基于上下文回答,提升信息提取准确率;低参数量微调:以较小的可训练参数优化模型,提高准确率并避免灾难性遗忘;引入布局特征:提升模型对无序输入的跨内容感知能力。

iconDocQA 模型效果icon

支持信息抽取、文本摘要,具备较强的理解能力,应用于腾讯云官网封闭式问答场景中,阅读理解准确率大幅提升。

iconMLLM--多模态大模型icon

从支持自然场景扩展至文档场景,Few-Shot Learning(ICL)在结构化等任务上表现优异

iconMLLM 核心技术icon
基于DocLm的强大文字视觉编码
集成多模态大模型支持开放问答
适用于摘要、理解、推理等高级场景
组件式设计策略
充分发挥LL能力
高度训练灵活性
场景适配技术
采用ICL上下文学习方法
快速适应不同场景
iconMLLM 模型效果icon

聚焦泛化场景的文字理解,支持开放问答:问题理解透彻,笞案流畅度高,支持ICL:根据少量几张图片及问答对示例,理解意图并做出正确预测,完成快速场景适配,具备归纳和理解能力。

iconTI-OCR 支持 OCR 大模型精调icon

DocLm会作为TI-OCR上的内置模型提供绐客户进行自定义业务下的训练精调,在压缩模型体量、节省训练成本、降低推理成本基础上,进一步提升特定场景下的OCR大模型指标。

iconTI-OCR 支持 OCR 大模型精调icon
iconOCR 大模型精调所需资源icon
icon典型案例icon
icon典型案例icon

大模型轻松解决曲文、水印、检测识别难例问题,各业务场景综合指标达98.6%+

icon典型案例icon

大模型解决自然场景下的识别难题,审核业务机器转人工占比降低80%。在商户入驻场景下,通过引入OCR大模型自动化申请材料的照片审核,有效降低机器转人工的比例,加速商户自助办理业务的流程。

产品推荐

声网Agora语音互动解决方案
声网Agora语音互动解决方案,全球音频互动一致性体验,优秀的弱网对抗能力,为用户在各种网络环境下提供流畅的互动体验。兼容 iOS、Android、Windows、macOS、Web、小程序等 30 大开发平台,保证全平台一致性体验,适配20000+移动终端。
免费试用
查看详情
数划云半导体行业预算分析解决方案
数划云半导体行业预算分析解决方案,新一代云原生xP&A:用户易用、数据全面、深度协同,帮助企业更好决策,优化预算管理流程、建立健全预算组织架构、制定预算管理制度、设计预算管理配套模板,搭建切实可行的预算管理模型、方法。
免费试用
查看详情
京东云京智低代码平台
京东云京智低代码平台,以领域模型驱动的低代码开发平台,提供全套一站式可视化Web开发工具,以拖拉拽形式快速搭建核心数字化系统,帮助实现企业数字化能力构建与业务创新。开箱即用的构建部署运维工具链,一键发布/升级全套微服务。
免费试用
查看详情
吕睿云客申通小助手
吕睿云客申通小助手,可多账号同时登录在线查件,给小助手发多次登录,选择对应工号进入系统 ,机器人通过关键字识别业务需求,网点可自定义添加业务关键字。自定义时间内不催件设置,默认目标网点给公司、服务点、营业部下催派类型协作任务,给中心下催件类型协作任务。
免费试用
查看详情