图片信息抽取

上传图片与提示词,同步返回结构化信息抽取结果。

POST/v1/ocr/image/extract

授权

Authorizationstringheader必填
HTTP: Bearer Auth
  • Security Scheme Type: http
  • HTTP Authorization Scheme: Bearer API_key,用于验证账户信息,可在 项目管理>API Key 中查看。

请求头

Content-Typeenum<string>默认值:multipart/form-data必填

请求体为表单数据,请使用multipart/form-data上传文件与字段。

可用选项:multipart/form-data

请求体multipart/form-data

model string 必填

模型 ID。当前可选值:u1-ocr-extract

image file 必填

待抽取的图片文件。

  • 支持格式:JPG、PNG
  • 大小限制:≤ 10MB

prompt string 必填

提示词,用于指导模型抽取指定信息。

示例:请提取图片中信息,schema如下:{"invoice_no":"发票号码","date":"开票日期","items":[{"name":"项目名称","total":"金额"}]}

响应体结构

contentstring

模型抽取返回的文本内容。

usageobject

Token 消耗统计对象。

usage.prompt_tokensinteger

输入 Token 数量

usage.completion_tokensinteger

输出 Token 数量

usage.total_tokensinteger

总 Token 消耗量

base_respobject

本次请求的状态码及其详情

base_resp.status_codeinteger

错误码说明:
  • 0,成功
  • 100001,缺失必填参数
  • 261001,图片格式错误,仅支持 JPG、PNG
  • 261002,图片大小超过 10MB 限制
  • 261003,图片文件损坏或无法解析
  • 261101,上游模型处理超时
  • 261999,系统内部异常

base_resp.status_msgstring

状态描述信息。成功为 success,失败为具体错误原因。