U1-OCR-Med
辨医疗文书,懂专业版式,会精准抽取
聚焦医疗文书解析,实现分类归档与信息抽取一体化
U1-OCR-Med:辨医疗文书,懂专业版式,会精准抽取
U1-OCR-MED 是专为医疗场景打造的文档智能模型,具备医疗文书分类、专业信息抽取一站式处理能力,精准适配病历、检查报告、处方、收费单据等各类医疗文档场景,高效解决手写潦草、术语缩写、印章遮挡、排版复杂等行业痛点,同时支持零样本跨领域泛化,兼顾医疗专业精度与业务落地效率。
90%+
节省人工录入工作量
30+
覆盖常见医疗文书类型
50+
精准抽取医疗核心业务字段
95%+
信息抽取准确率
U1-OCR-MED 在医疗文书分类、多场景信息抽取任务上表现全面领先,医疗文书分类准确率达 98.2%,综合识别能力显著优于 Gemini、Qwen 等同级别主流大模型;票据类抽取准确率 95.31%、病历类抽取准确率 95.65%,面对专业医学术语、差异化行文表述仍保持高精准度,达到行业领先水准;卡证类抽取准确率高达 98.87%,具备极强的场景适配性与识别稳定性,能够满足医疗业务高精度、高可靠的落地使用要求。

文书分类
票据类抽取
病历类抽取
卡证类抽取
核心优势
医学语义深度理解
不止识别文字,更能读懂医疗术语、诊断表述与业务逻辑,适配各类医院差异化书写习惯。
复杂场景稳定适配
对潦草手写、印章遮挡、折痕拍摄、多页混排等医疗真实场景,均能保持高识别与抽取精度。
结果可信可直接落地
抽取字段自动标准化,支持像素级定位溯源,无需大量人工复核,可直接对接业务系统入库。
全流程批量处理能力
支持多页文档连贯解析与批量抽取,大幅提升病历归档、医保结算等业务的处理效率。
低门槛快速接入
兼容主流图片、PDF 等文件格式,支持 API 标准化对接,无需复杂开发即可融入现有医疗系统。
技术亮点
医学专业知识与多模态深度融合
将医学专业知识库和视觉 - 语言对齐技术深度结合,不只是识文字,真正理解医疗术语、诊断语义和业务逻辑,远超通用 OCR 字面识别能力。
OCR 3.0 深层语义理解架构
延续第三代文档智能语义理解能力,区别于传统 CRNN 浅层识别、普通 VLM 版面理解精度不足的短板,主打医疗专业级语义读懂。
复杂医疗版式自适应解析
原生适配病历、处方、检查报告等非标复杂排版,支持多文档混叠、单图多文件自动分割与独立解析归档。
高鲁棒性非标场景识别能力
专项适配医疗行业真实痛点:手写潦草、医学缩写术语、公章遮挡、拍照歪斜、内容残缺等长尾场景,识别稳定性强。
应用场景
病历结构化归档
住院 / 出院记录、门诊病历、病程记录的自动分类与信息提取。
检查报告智能解析
影像报告、检验报告、病理报告的结构化处理与指标提取。
医疗费用单据处理
收费清单、结算票据的金额明细提取与对账核对。
医保与商保业务支撑
理赔单据结构化解析、报销材料智能分类与信息校验。
能力
自动判别各类医疗文书类型,完成批量分类归档。
精准还原医疗文书复杂排版与嵌套表格结构。
抽取患者信息、诊断结果、检查指标、用药详情、费用明细等核心业务字段。
适配不同医院格式差异,实现字段标准化与统一映射。
支持多页文档连贯解析与批量处理,大幅提升业务效率。
兼容手写内容、印章遮挡、术语缩写等复杂医疗场景。
灵活计费,专属方案,私有化部署
U1-OCR-Med:辨医疗文书,懂专业版式,会精准抽取
U1-OCR-MED 是专为医疗场景打造的文档智能模型,具备医疗文书分类、专业信息抽取一站式处理能力,精准适配病历、检查报告、处方、收费单据等各类医疗文档场景,高效解决手写潦草、术语缩写、印章遮挡、排版复杂等行业痛点,同时支持零样本跨领域泛化,兼顾医疗专业精度与业务落地效率。
节省人工录入工作量
覆盖常见医疗文书类型
精准抽取医疗核心业务字段
信息抽取准确率
U1-OCR-MED 在医疗文书分类、多场景信息抽取任务上表现全面领先,医疗文书分类准确率达 98.2%,综合识别能力显著优于 Gemini、Qwen 等同级别主流大模型;票据类抽取准确率 95.31%、病历类抽取准确率 95.65%,面对专业医学术语、差异化行文表述仍保持高精准度,达到行业领先水准;卡证类抽取准确率高达 98.87%,具备极强的场景适配性与识别稳定性,能够满足医疗业务高精度、高可靠的落地使用要求。

文书分类
票据类抽取
病历类抽取
卡证类抽取
核心优势
医学语义深度理解
不止识别文字,更能读懂医疗术语、诊断表述与业务逻辑,适配各类医院差异化书写习惯。
复杂场景稳定适配
对潦草手写、印章遮挡、折痕拍摄、多页混排等医疗真实场景,均能保持高识别与抽取精度。
结果可信可直接落地
抽取字段自动标准化,支持像素级定位溯源,无需大量人工复核,可直接对接业务系统入库。
全流程批量处理能力
支持多页文档连贯解析与批量抽取,大幅提升病历归档、医保结算等业务的处理效率。
低门槛快速接入
兼容主流图片、PDF 等文件格式,支持 API 标准化对接,无需复杂开发即可融入现有医疗系统。
技术亮点
医学专业知识与多模态深度融合
将医学专业知识库和视觉 - 语言对齐技术深度结合,不只是识文字,真正理解医疗术语、诊断语义和业务逻辑,远超通用 OCR 字面识别能力。
OCR 3.0 深层语义理解架构
延续第三代文档智能语义理解能力,区别于传统 CRNN 浅层识别、普通 VLM 版面理解精度不足的短板,主打医疗专业级语义读懂。
复杂医疗版式自适应解析
原生适配病历、处方、检查报告等非标复杂排版,支持多文档混叠、单图多文件自动分割与独立解析归档。
高鲁棒性非标场景识别能力
专项适配医疗行业真实痛点:手写潦草、医学缩写术语、公章遮挡、拍照歪斜、内容残缺等长尾场景,识别稳定性强。
应用场景
病历结构化归档
住院 / 出院记录、门诊病历、病程记录的自动分类与信息提取。
检查报告智能解析
影像报告、检验报告、病理报告的结构化处理与指标提取。
医疗费用单据处理
收费清单、结算票据的金额明细提取与对账核对。
医保与商保业务支撑
理赔单据结构化解析、报销材料智能分类与信息校验。
能力
- 自动判别各类医疗文书类型,完成批量分类归档。
- 精准还原医疗文书复杂排版与嵌套表格结构。
- 抽取患者信息、诊断结果、检查指标、用药详情、费用明细等核心业务字段。
- 适配不同医院格式差异,实现字段标准化与统一映射。
- 支持多页文档连贯解析与批量处理,大幅提升业务效率。
- 兼容手写内容、印章遮挡、术语缩写等复杂医疗场景。





