文档信息抽取与分类
文档信息抽取与分类服务,通过指定场景精准识别并提取医疗、财务、政务等多场景文档中的关键字段,支持自定义配置,实现从病历、票据到合同表单的高效结构化处理,提升数据处理效率与准确性。
根据图片提取信息
调用文档信息抽取与分类接口,设定场景及prompt,提取指定JSON格式的结构化信息。
Python
import requests
import os
import mimetypes
url = "https://maas-api.hivoice.cn/v1/ocr/image/extract"
api_key = os.environ.get("API_KEY")
headers = {"Authorization": f"Bearer {api_key}"}
IMAGE_PATH = "invoice.png"
PROMPT = "请提取图片中的信息,严格按 JSON 格式输出"。
Schema 如下:
{
"invoice_no": "发票号码",
"date": "开票日期",
"items": [{"name": "项目名称", "total": "金额"}]
}
payload = {
"model": "u1-ocr",
"prompt": PROMPT,
}
with open(IMAGE_PATH, "rb") as image_file:
files = {
"image": (
os.path.basename(IMAGE_PATH),
image_file,
mimetypes.guess_type(IMAGE_PATH)[0]
)
}
response = requests.post(url, headers=headers, data=payload, files=files)
result = response.json()
print(f"{result['content']}")
应用示例
输入
prompt
你的任务是从上述图片中提取信息并结构化成json格式。
严格遵循以下schema定义的信息提取要求(不存在的字段,结果用空字符串表示):
{
"发票号码": "",
"开票日期": "",
"items": [
{"项目名称": "",
"单价": "",
"数量": "",
"总金额": ""
}]
}
输出
{
"发票号码": "25117000001021449288",
"开票日期": "2025年08月07日",
"items": [
{
"项目名称": "*运输服务*客运服务费",
"单价": "105.95",
"数量": "1",
"总金额": "105.95"
}
]
}
