模型发布 | 文档中心
查看最新模型发布动态,覆盖文本、语音、视觉等模型信息,帮助开发者了解平台最新模型能力。
Unisound U2
文本
支持自主规划、工具调用、多 Agent 协同、长程任务编排与自主纠错,可完成从目标理解到结果交付的全链路执行,兼顾高效推理与低 Token 消耗。
查看详情
U1-InsureMed
文本
提供面向医保场景的智能问答与内容理解能力,支持对病历、检查报告、体检结果、医保政策、保险条款等内容进行分析、解读与重点提炼。支持多轮对话,可用于医保相关场景下的问题解答、内容理解与连续追问。
查看详情
U2-ASR
语音
复杂噪音与方言场景识别准确率业内首次突破90%,多语种、全体系方言覆盖,长音频结构化转写,快速可靠、易落地。
查看详情
U2-TTS
语音
语义理解与细腻情感表达双突破,高度拟人化,创意多元,赋予语音自然表达力
查看详情
U2-TTS-Clone
语音
一句话样本即可秒级克隆音色,支持情感迁移与中英跨语种合成,快速沉淀品牌 / 角色专属声音资产。
查看详情
U1-OCR
视觉
融合视觉与语义解析能力,具备完善文档处理能力,兼容多语种、手写及各类非标文档,可满足个人日常文件打理与企业文档数字化处理需求。
查看详情
U1-OCR-Med
视觉
专为医疗场景打造,适配病历、处方、检查报告、收费单据等各类医疗文档,可高效处理复杂医学表述与手写、印章等特殊场景,助力智慧医疗业务高效落地。
查看详情







