按量计费
模型价格可能会根据业务情况、运营成本及策略发生不定时调整,请关注最新规则。
语音
U2-ASR
专业的音频文件转写大模型,支持多场景、多语种音频转文本。可将会议录音、课堂讲座、客服录音等音频内容快速准确转写为文本,帮助开发者实现语音内容数字化与智能分析。
立即充值 资源包更实惠,低至 0.3 元/小时
| 模型名称 | 输入(元/小时) |
|---|---|
| U2-ASR | 0.4 |
U2-TTS
提供自然流畅的文本转语音能力,支持多音色、多情感语音生成。可用于智能语音播报、内容朗读等场景,为应用提供拟人化、高质量的语音输出体验。
立即充值 资源包更实惠,低至 0.3 元/万字
| 模型名称 | 输入(元/万字) |
|---|---|
| U2-TTS | 0.4 |
U2-TTS-Clone
支持声音克隆与个性化语音生成,仅需一句语音样本即可还原目标声音特征。让开发者轻松构建个性化语音交互体验。
立即充值 资源包更实惠,低至 3.38 元/万字
| 模型名称 | 输入(元/万字) |
|---|---|
| U2-TTS-Clone | 4.5 |
视觉
U1-OCR-Parser
聚焦文档深度解析、结构还原、版式理解,支持 PDF、扫描件、图片等复杂文档智能解析,自动提取文本、表格、签章、批注与篇章结构,输出标准化结构化数据。
立即充值 资源包更实惠,低至 0.68 元/百万 tokens
| 模型名称 | 输出(元/百万 tokens) |
|---|---|
| U1-OCR-Parser | 0.9 |
U1-OCR-Extract
提供高精度文档解析能力,支持图片文字识别、文档结构分析及关键信息提取。可应用于票据识别、合同解析、文档数字化与信息抽取等场景,实现办公流程自动化与数据智能处理。
立即充值 资源包更实惠,低至 0.23 元/百万 tokens
| 模型名称 | 输出(元/百万 tokens) |
|---|---|
| U1-OCR-Extract | 0.3 |