按量计费

模型价格可能会根据业务情况、运营成本及策略发生不定时调整,请关注最新规则。

语音

U2-ASR

专业的音频文件转写大模型,支持多场景、多语种音频转文本。可将会议录音、课堂讲座、客服录音等音频内容快速准确转写为文本,帮助开发者实现语音内容数字化与智能分析。

立即充值 资源包更实惠,低至 0.3 元/小时

模型名称输入(元/小时)
U2-ASR0.4

U2-TTS

提供自然流畅的文本转语音能力,支持多音色、多情感语音生成。可用于智能语音播报、内容朗读等场景,为应用提供拟人化、高质量的语音输出体验。

立即充值 资源包更实惠,低至 0.3 元/万字

模型名称输入(元/万字)
U2-TTS0.4

U2-TTS-Clone

支持声音克隆与个性化语音生成,仅需一句语音样本即可还原目标声音特征。让开发者轻松构建个性化语音交互体验。

立即充值 资源包更实惠,低至 3.38 元/万字

模型名称输入(元/万字)
U2-TTS-Clone4.5

视觉

U1-OCR-Parser

聚焦文档深度解析、结构还原、版式理解,支持 PDF、扫描件、图片等复杂文档智能解析,自动提取文本、表格、签章、批注与篇章结构,输出标准化结构化数据。

立即充值 资源包更实惠,低至 0.68 元/百万 tokens

模型名称输出(元/百万 tokens)
U1-OCR-Parser0.9

U1-OCR-Extract

提供高精度文档解析能力,支持图片文字识别、文档结构分析及关键信息提取。可应用于票据识别、合同解析、文档数字化与信息抽取等场景,实现办公流程自动化与数据智能处理。

立即充值 资源包更实惠,低至 0.23 元/百万 tokens

模型名称输出(元/百万 tokens)
U1-OCR-Extract0.3
灵活计费,专属方案,全周期陪伴企业 AI 增长