U1-OCR
辨证照,识文档,会抽取
证照、文档智能解析,关键信息一键提取
U1-OCR:辨证照,识文档,会抽取
U1-OCR 是一款智能文档解析与抽取模型,突破传统 OCR 仅字符识别的局限,实现从“认字”到“懂文档、会提取”的升级。可一站式完成证照识别、版式还原、关键信息抽取,将非结构化文档自动转为规整可用的数据,覆盖日常办公、证照票据、复杂报表等全场景,大幅节省人工录入与核对时间。
99+%
内容识别准确率
50+
语言支持
100+
文档类型覆盖
<1s
单页信息识别提取
U1-OCR 在关键信息提取(KIE)能力的权威基准测试 Nanonets-KIE、CC-OCR-KIE 中,分别以 93.4、94.86 的分数达到业界 SOTA 水平,性能表现优于当前主流多模态 OCR 大模型及通用多模态大模型;同时,在权威文档解析榜单 OmniDocBench V1.5 中以 94.63 分取得 SOTA 水平。
核心优势
解放双手,告别繁琐劳作
依托全流程智能处理能力,自动完成文件归类与信息筛选,彻底告别手动整理文件夹、逐字手动录入信息的重复劳作,把宝贵时间留给更有价值的事。
极简上手,人人轻松驾驭
个人用户无需学习专业知识,上传文件即可一键启用全部功能;企业用户支持灵活功能定制,依托标准化接口快速完成系统联动,适配各类使用习惯。
原貌复刻,守护文档质感
无惧复杂排版与多样版式,精准还原文件原有布局架构,让识别输出内容整齐规整,再也不用担心排版错乱、内容移位、格式丢失等问题。
全格式兼容,随心轻松处理
打破文件格式壁垒,无论是随手拍摄的图片、专业纸质扫描件,还是主流办公格式文件,都能顺畅上传、快速解析,随时随地处理各类文档。
灵活适配,囊括多样内容
突破常规识别局限,可精准识别手写文字、实体公章印记、手写批注以及各类特殊符号,拓展更多实用使用场景。
技术亮点
深度视觉语义融合技术
不止单纯识别文字像素,同步联动视觉结构感知与文本语义理解,真正读懂文档布局逻辑与内容含义,告别机械式文字转录。
异形版式自适应还原算法
针对歪斜拍摄、折痕文稿、非标准排版文件做专项优化,自动矫正画面视角,智能适配各类不规则版式,还原效果远超通用识别方案。
全栈式智能理解
一站式搞定文档归类、版式还原、内容解读与重点提取,从整理文件到抓取核心信息全程智能完成。
多场景异构数据归一处理
可适配拍照原图、高清扫描件、复杂版式文档、模糊翻拍图等不同质量素材,统一规整输出标准结构化内容,素材兼容性极强。
应用场景
证件信息快速录入
身份证、护照、银行卡等证件拍照识别,一键提取信息,告别手动打字。
发票报销智能整理
电子 / 纸质发票自动识别、提取金额 / 日期 / 抬头,报销录入更省心。
手写笔记转电子档
课堂笔记、会议记录、手写清单拍照转文字,可编辑、可搜索。
多语种资料轻松抽取
外文资料、笔记、截图一键识别抽取,阅读和整理更高效。
能力
智能文档分类:
依托 OCR3.0 智能认知,自动识别文档类型并精准分类,适配各类办公与业务文档,支持 JSON Schema 自定义分类类目,满足各行业定制化分类需求。
通用信息抽取:
借助 OCR3.0 语义能力,无需预设字段,自动提取文档内时间、金额、机构等各类关键信息,适配通用业务场景,减少人工操作。
定制化 Schema 提取:
通过 JSON Schema 自定义提取字段、格式与规则,定向精准抓取指定业务信息,提升数据处理效率与准确率。
复杂版式高精度解析:
智能识别文档层级、图文、分区结构,优化各类异形表格解析,完整还原表格数据,精准解析研报、台账、报表等专业复杂版式文档。
非常规复杂内容识别:
适配各类非标准化文档,精准识别手写文字、印章、批注、代码、特殊符号等特殊内容,解决传统识别漏错缺问题。
灵活计费,专属方案,私有化部署
U1-OCR
辨证照,识文档,会抽取
证照、文档智能解析,关键信息一键提取
U1-OCR:辨证照,识文档,会抽取
U1-OCR 是一款智能文档解析与抽取模型,突破传统 OCR 仅字符识别的局限,实现从“认字”到“懂文档、会提取”的升级。可一站式完成证照识别、版式还原、关键信息抽取,将非结构化文档自动转为规整可用的数据,覆盖日常办公、证照票据、复杂报表等全场景,大幅节省人工录入与核对时间。
内容识别准确率
语言支持
文档类型覆盖
单页信息识别提取
U1-OCR 在关键信息提取(KIE)能力的权威基准测试 Nanonets-KIE、CC-OCR-KIE 中,分别以 93.4、94.86 的分数达到业界 SOTA 水平,性能表现优于当前主流多模态 OCR 大模型及通用多模态大模型;同时,在权威文档解析榜单 OmniDocBench V1.5 中以 94.63 分取得 SOTA 水平。
核心优势
解放双手,告别繁琐劳作
依托全流程智能处理能力,自动完成文件归类与信息筛选,彻底告别手动整理文件夹、逐字手动录入信息的重复劳作,把宝贵时间留给更有价值的事。
极简上手,人人轻松驾驭
个人用户无需学习专业知识,上传文件即可一键启用全部功能;企业用户支持灵活功能定制,依托标准化接口快速完成系统联动,适配各类使用习惯。
原貌复刻,守护文档质感
无惧复杂排版与多样版式,精准还原文件原有布局架构,让识别输出内容整齐规整,再也不用担心排版错乱、内容移位、格式丢失等问题。
全格式兼容,随心轻松处理
打破文件格式壁垒,无论是随手拍摄的图片、专业纸质扫描件,还是主流办公格式文件,都能顺畅上传、快速解析,随时随地处理各类文档。
灵活适配,囊括多样内容
突破常规识别局限,可精准识别手写文字、实体公章印记、手写批注以及各类特殊符号,拓展更多实用使用场景。
技术亮点
深度视觉语义融合技术
不止单纯识别文字像素,同步联动视觉结构感知与文本语义理解,真正读懂文档布局逻辑与内容含义,告别机械式文字转录。
异形版式自适应还原算法
针对歪斜拍摄、折痕文稿、非标准排版文件做专项优化,自动矫正画面视角,智能适配各类不规则版式,还原效果远超通用识别方案。
全栈式智能理解
一站式搞定文档归类、版式还原、内容解读与重点提取,从整理文件到抓取核心信息全程智能完成。
多场景异构数据归一处理
可适配拍照原图、高清扫描件、复杂版式文档、模糊翻拍图等不同质量素材,统一规整输出标准结构化内容,素材兼容性极强。
应用场景
证件信息快速录入
身份证、护照、银行卡等证件拍照识别,一键提取信息,告别手动打字。
发票报销智能整理
电子 / 纸质发票自动识别、提取金额 / 日期 / 抬头,报销录入更省心。
手写笔记转电子档
课堂笔记、会议记录、手写清单拍照转文字,可编辑、可搜索。
多语种资料轻松抽取
外文资料、笔记、截图一键识别抽取,阅读和整理更高效。
能力
智能文档分类:
依托 OCR3.0 智能认知,自动识别文档类型并精准分类,适配各类办公与业务文档,支持 JSON Schema 自定义分类类目,满足各行业定制化分类需求。
通用信息抽取:
借助 OCR3.0 语义能力,无需预设字段,自动提取文档内时间、金额、机构等各类关键信息,适配通用业务场景,减少人工操作。
定制化 Schema 提取:
通过 JSON Schema 自定义提取字段、格式与规则,定向精准抓取指定业务信息,提升数据处理效率与准确率。
复杂版式高精度解析:
智能识别文档层级、图文、分区结构,优化各类异形表格解析,完整还原表格数据,精准解析研报、台账、报表等专业复杂版式文档。
非常规复杂内容识别:
适配各类非标准化文档,精准识别手写文字、印章、批注、代码、特殊符号等特殊内容,解决传统识别漏错缺问题。





