左手医生病历OCR识别及结构化数据处理系统

申请试用

左手医生病历OCR识别及结构化处理系统基于OCR和自然语言处理技术将门诊/住院病历、检查检验报告、处方/医嘱等医疗文档自动识别、转换为结构化数据，支持下游可视化、统计分析、推理等应用，可用于健康档案、质控、保险理赔及临床科研等业务场景。

立即咨询

首页 > 产品中心 > 图文识别OCR > 左手医生病历OCR识别及结构化数据处理系统

应用场景

病历检索

如给定一些关键词或属性关系，找出符合条件的病历。

相似病历推荐

如给定一个病历，找出病历库中相似病历。

统计分析、临床科研

如统计哪些人群、地域常出现的症状、疾病、适用的药品、检查等用于病理学研究。

辅助/AI诊断

如用于学习历史病历数据，建立疾病预测模型，辅助医生诊断等。

业务风险评估

如帮助保险公司规范和结构化客户病历信息，便于分析和评估客户的风险成本。

CRF表单映射

挖掘病历有效信息，针对CRF表单自动填充，节省人工成本。

构建大数据中心

数据标准化、规模化，如用于知识图谱构建，通过结构化数据构造SPO三元组。

产品介绍

医疗信息结构化识别

基于OCR+病历结构化技术，抽取文档关键字段、医学实体及属性信息，抽取结果结构化展示。支持病历、检查化验、处方、医疗发票等医疗文档类型。

医疗文档自动分类

支持化验报告(如血常规、尿常规、血生化等)文档类型的自动识别。

敏感信息定制化屏蔽

支持医疗内容中如性别、年龄、住院号等基础信息识别与屏蔽，支持配置扩展。

关键信息高亮展示

支持结构化实体信息在原图片位置高亮展示，方便人工评估定位。

产品优势

简单易用
导入扫描图或拍照图快速获得医疗信息结构化展示，支持多种图片格式，提供稳定可靠规范的API接口。

细粒度解析
依托医疗知识图谱，支持医疗关键字段抽取，进一步支持细粒度分析和抽取医学实体、属性和关系，抽取结果符合通用医学术语标准。

适应范围广
能有效处理常见门诊/住院病历、多种布局检查化验报告、处方、医嘱等医疗单据图片。

安全可靠
可定制屏蔽敏感信息，服务响应快速稳定。

API接口

病历结构化API通过http post请求的方式进行调用，既能远程调用，也可以实现本地私有化部署。应用方在程序内引入该API可以实现对病历文本的自动处理，将返回的json或xml的结构化数据进行结构化存储，用于进一步的检索、预警或科研统计分析等。

信息结构化

支持2种数据结构的结构化，包括自然语言结构化和病历结构化

结果查看-可视化界面 icon

病历抽取的结果按照实体分类展示在病历右侧。高亮/放大显示——点击『显示所有实体』病历中抽取的实体会在病历原文中高亮显示，不同类别的实体对应不同的背景色。点击某一类别标签，该类别在抽取结果在上移。高亮显示后，点击右侧抽取结果中的某个实体，则对应实体在病历原文中放大显示﹔同理，点击病历原文中任一高亮显示的实体，该实体在右侧抽取结果中颜色加深。

结果查看- json展示 icon

数据的导入与导出

点击右上角的『文件导入』功能键可以上传本地的病历文件进行评估。病历文件可以为txt文件(gbk编码)，或excel文件形式。

数据修改和标注

错召结果标注

点击右侧召回实体，显示错误列表，对错误召回的实体可以选取错误类型，对抽取错误的属性可以直接勾选。

漏召结果标注

漏召回的实体可以直接在原文中进行标注:使用鼠标划取病历原文中含有漏召回实体、属性的句子，点击鼠标右键，点击『召回』按键，将会弹出对应的标注框，在标注框可以选取句中漏召实体、属性的类别与数量。

数据修改和标注

数据标注界面包括『要素切分』、『实体着色』『成分链接』﹑『属性标注』四个功能键。数据评估中错误、漏召的句子示例将自动引入数据标注界面进行标注，此外，用户也可以手动添加需要标注的句子。以手动添加case标注示例。

数据修改和标注

要素切分工具可以对待标注示例句子进行要素切分，通过鼠标在需要切分的文字间隔点击实现。通过实体着色功能，从实体类别着色板中选取要标注的实体类别颜色，再点击相应的要素进行实体上色，此时，对应要素进入”标注实体”列表。

数据修改和标注

部分实体由多个要素拼接组成，此时，实体标注是需要先将同一实体的要素进行链接，再进行实体着色。实体连接操作为:选取『实体链接』工具，点击待标注实体的多个相关要素。点击“腰部”和“疼痛”组成“腰部疼痛”，再进行着色。标注句子中部分实体存在一个或多个属性描述，通过属性标注功能可以进行属性字段填充，属性填充首先选取要添加属性的实体，点击『属性标注』工具，通过下拉列表选取属性名（KEY)﹔通过句子要素点选选取属性值(VALUE），对应部分属性存在多个属性值（如值阈范围），可以点击””，添加多个属性值，也可通过收到输入添加属性值;部分属性带有数值单位(UNIT)，可以通过点选或手动输入进行填充。