语音声音克隆
未检测到 API Key,请点击右上角「配置 API Key」按钮后再使用调试功能。
1提供克隆音频 (file_id)*

支持格式: 单声道 WAV

大小限制: ≤ 20MB

时长要求:最少 5 秒,最长 2 分钟;推荐 5~15 秒

2配置音色 ID (voice_id)*
8-64 位,英文字母开头,支持字母/数字/-/_,末位不能为 - 或 _;voice_id 不可重复
3风格音频 (可选)
4试听配置 (可选)
任务信息
File ID-
Trace ID-
状态-
使用指南
建议上传的音频文件时长最少不低于 5 秒,最长不超过 2 分钟
克隆音频和风格音频建议使用清晰、无杂音的人声录音
克隆时如果提供风格音频和对应的文本,系统可提取该音频中的风格与情感特征,并结合克隆音频中的音色信息进行合成,风格音频与克隆音频可来自不同发音人。
语音合成可选择 u2-tts-clone 模型,使用对应 voice_id 即可调用克隆音色。
API 参考
CURL
curl -X POST "https://maas-api.hivoice.cn/v1/audio/voices/clone" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "file_id": ,
    "voice_id": "",
    "model": "u2-tts-clone",
    "clone_prompt": {
      "prompt_audio": ,
      "prompt_text": ""
    },
    "text": ""
  }'
请求体 JSON
{
    "file_id": ,
    "voice_id": "",
    "model": "u2-tts-clone",
    "clone_prompt": {
      "prompt_audio": ,
      "prompt_text": ""
    },
    "text": ""
  }