文档信息抽取与分类

文档信息抽取与分类服务,通过指定场景精准识别并提取医疗、财务、政务等多场景文档中的关键字段,支持自定义配置,实现从病历、票据到合同表单的高效结构化处理,提升数据处理效率与准确性。

​根据图片提取信息

调用文档信息抽取与分类接口,设定场景及prompt,提取指定JSON格式的结构化信息。

Python
import requests
import os
import mimetypes

url = "https://maas-api.hivoice.cn/v1/ocr/image/extract"
api_key = os.environ.get("API_KEY")
headers = {"Authorization": f"Bearer {api_key}"}

IMAGE_PATH = "invoice.png"
PROMPT = "请提取图片中的信息,严格按 JSON 格式输出"。
Schema 如下:
{
  "invoice_no": "发票号码",
  "date": "开票日期",
  "items": [{"name": "项目名称", "total": "金额"}]
}

payload = {
  "model": "u1-ocr",
  "prompt": PROMPT,
}

with open(IMAGE_PATH, "rb") as image_file:
  files = {
    "image": (
      os.path.basename(IMAGE_PATH),
      image_file,
      mimetypes.guess_type(IMAGE_PATH)[0]
    )
  }
  response = requests.post(url, headers=headers, data=payload, files=files)

result = response.json()
print(f"{result['content']}")

应用示例

输入
发票示例图片
prompt


你的任务是从上述图片中提取信息并结构化成json格式。
严格遵循以下schema定义的信息提取要求(不存在的字段,结果用空字符串表示):
{
  "发票号码": "",
  "开票日期": "",
  "items": [
    {"项目名称": "", 
    "单价": "",
    "数量": "",
    "总金额": ""
  }]
}
输出

{
  "发票号码": "25117000001021449288",
  "开票日期": "2025年08月07日",
  "items": [
    {
      "项目名称": "*运输服务*客运服务费",
      "单价": "105.95",
      "数量": "1",
      "总金额": "105.95"
    }
  ]
}