模型发布 | 文档中心

查看最新模型发布动态，覆盖文本、语音、视觉等模型信息，帮助开发者了解平台最新模型能力。

Unisound U2

文本

支持自主规划、工具调用、多 Agent 协同、长程任务编排与自主纠错，可完成从目标理解到结果交付的全链路执行，兼顾高效推理与低 Token 消耗。

查看详情

U2-Med

文本

具备医疗 · 医保 · 医药全场景专业能力，覆盖临床、审核、风控、健康管理、医药研发，提供精准可信赖的三医智能服务。

查看详情

U2-ASR

语音

复杂噪音与方言场景识别准确率业内首次突破90%，多语种、全体系方言覆盖，长音频结构化转写，快速可靠、易落地。

查看详情

U2-TTS

语音

语义理解与细腻情感表达双突破，高度拟人化，创意多元，赋予语音自然表达力

查看详情

U2-TTS-Clone

语音

一句话样本即可秒级克隆音色，支持情感迁移与中英跨语种合成，快速沉淀品牌 / 角色专属声音资产。

查看详情

U1-OCR

视觉

融合视觉与语义解析能力，具备完善文档处理能力，兼容多语种、手写及各类非标文档，可满足个人日常文件打理与企业文档数字化处理需求。

查看详情

U1-OCR-Med

视觉

专为医疗场景打造，适配病历、处方、检查报告、收费单据等各类医疗文档，可高效处理复杂医学表述与手写、印章等特殊场景，助力智慧医疗业务高效落地。

查看详情