创建异步语音转写任务

开发指南 API参考

Skill 文档模型价格 Token Plan 模型发布

创建语音转写任务，支持多种音频格式，支持输出时间戳及说话人信息。

POST/v1/audio/asr/tasks

授权

Authorizationstringheader必填

HTTP: Bearer Auth

Security Scheme Type: http
HTTP Authorization Scheme: Bearer API_key，用于验证账户信息，可在按量计费&资源包>API Key 管理中查看。

请求头

Content-Typeenum<string>默认值:application/json必填

请求体的媒体类型，请设置为application/json以确保请求数据格式正确。

可用选项：application/json

请求体application/json

file_id long 选填

音频文件 ID（通过文件上传接口获取）。与 file_url 二选一。

file_url string 选填

公网可访问的 http(s) 音频直链，长度不超过 2048 字符。若 URL 含特殊字符须 UrlEncode；已带签名的 URL 请勿二次编码。与 file_id 二选一。

异步语音识别文件需遵从以下规范：

格式：mp3、opus、wav、amr、m4a、ogg
时长：最少不低于 1 秒，最长不超过 5 小时
大小：不超过 1GB

modelenum<string>必填

模型编码可用选项：u2-asr

format string 必填

语音文件类型：mp3、opus、wav、amr、m4a、ogg。

sample_rate integer

音频采样率，默认 16000。

enable_auto_lang boolean

是否开启语种自动识别，默认 false。

language string

指定语种。可选值：

zh-CN (中文)
en-US (英语)
ar-SA (阿拉伯语)
de-DE (德语)
es-MX (西班牙语)
fr-FR (法语)
id-ID (印尼语)
ja-JP (日语)
ko-KR (韩语)
pt-BR (葡萄牙语)
ru-RU (俄语)
tr-TR (土耳其语)
vi-VN (越南语)
th-TH (泰语)
it-IT (意大利语)

enable_itn boolean

是否启用阿拉伯数字转换（如将"一九九七年"转为"1997年"），默认 true。

channel integer

音频声道数，1(mono) / 2(stereo)，默认为 1。

enable_speaker boolean

是否启用说话人分离，channel 为单声道时有效，默认 false。

speaker_num integer

说话人数量（仅当启用说话人分离时有效），默认自动识别人数。

speaker_ids string[ ]

注册声纹ID（仅当启用说话人分离时有效），最多支持10个

word_info boolean

是否返回单词级别的时间戳，默认 false。

context string

上下文，用于指定模型的上下文信息，限制 500 字。

hotwords string[ ]

热词列表，热词个数<=200，每个热词<=5 字符。

响应体结构

task_idstring

转写任务 ID

base_respobject

本次请求的状态码及其详情

base_resp.status_codeinteger

状态码（0=正常；100001=参数错误；100101=鉴权失败；100501=触发 RPM 限流；100999=系统内部错误）

base_resp.status_msgstring

状态详情

Start Transcribe

curl --request POST \
  --url https://maas-api.unisound.com/v1/audio/asr/tasks \
  --header 'Authorization: Bearer <api_key>' \
  --header 'Content-Type: application/json' \
  --data '
  {
    "file_id": 871009177767936,
    "model": "u2-asr",
    "format": "mp3",
    "sample_rate": 16000,
    "enable_itn": true,
    "channel": 1,
    "enable_speaker": false,
    "speaker_num": 2,
    "word_info": true,
    "context": "上下文信息（限制500字）",
    "hotwords": [
        "元宇宙",
        "区块链"
      ]
  }
'

200

{
  "task_id": "task_1234567890abcdef",
  "base_resp": {
    "status_code": 0,
    "status_msg": "success"
  }
}