图片信息抽取
上传图片与提示词,同步返回结构化信息抽取结果。
POST/v1/ocr/image/extract
授权
Authorizationstringheader必填
HTTP: Bearer Auth
- Security Scheme Type: http
- HTTP Authorization Scheme: Bearer API_key,用于验证账户信息,可在 项目管理>API Key 中查看。
请求头
Content-Typeenum<string>默认值:multipart/form-data必填
请求体为表单数据,请使用multipart/form-data上传文件与字段。
可用选项:multipart/form-data
请求体multipart/form-data
model string 必填
模型 ID。当前可选值:u1-ocr-extract
image file 必填
待抽取的图片文件。
- 支持格式:JPG、PNG
- 大小限制:≤ 10MB
prompt string 必填
提示词,用于指导模型抽取指定信息。
示例:请提取图片中信息,schema如下:{"invoice_no":"发票号码","date":"开票日期","items":[{"name":"项目名称","total":"金额"}]}
响应体结构
contentstring
模型抽取返回的文本内容。
usageobject
Token 消耗统计对象。
usage.prompt_tokensinteger
输入 Token 数量
usage.completion_tokensinteger
输出 Token 数量
usage.total_tokensinteger
总 Token 消耗量
base_respobject
本次请求的状态码及其详情
base_resp.status_codeinteger
错误码说明:
- 0,成功
- 100001,缺失必填参数
- 261001,图片格式错误,仅支持 JPG、PNG
- 261002,图片大小超过 10MB 限制
- 261003,图片文件损坏或无法解析
- 261101,上游模型处理超时
- 261999,系统内部异常
base_resp.status_msgstring
状态描述信息。成功为 success,失败为具体错误原因。