Unisound U2
原生Agent大模型,更快、更省、更强
以高智能密度重新定义速度、成本、可靠执行
U2-ASR
不止听见声音,更能理解表达
方言全覆盖,支持行业术语识别、一句话识别与实时转写
U2-TTS
以声传意,表达自有温度
不止朗读文字,更演绎语气、情绪与细节
U2-TTS-Clone
轻样本高保真,快速克隆专属音色
音色克隆 + 情感迁移,让表达更像“人”
U1-OCR
辨证照,识文档,会抽取
证照、文档智能解析,关键信息一键提取
Token Plan
5款顶尖AI模型,一Key调用
模型发布
查看最新模型发布动态
文档中心
接口说明与开发者接入指南
Unisound U2
文本
支持自主规划、工具调用、多 Agent 协同、长程任务编排与自主纠错,可完成从目标理解到结果交付的全链路执行,兼顾高效推理与低 Token 消耗。
查看详情
U1-InsureMed
文本
提供面向医保场景的智能问答与内容理解能力,支持对病历、检查报告、体检结果、医保政策、保险条款等内容进行分析、解读与重点提炼。支持多轮对话,可用于医保相关场景下的问题解答、内容理解与连续追问。
查看详情
U2-ASR
语音
复杂噪音与方言场景识别准确率业内首次突破90%,多语种、全体系方言覆盖,长音频结构化转写,快速可靠、易落地。
查看详情
U2-TTS
语音
语义理解与细腻情感表达双突破,高度拟人化,创意多元,赋予语音自然表达力
查看详情
U2-TTS-Clone
语音
一句话样本即可秒级克隆音色,支持情感迁移与中英跨语种合成,快速沉淀品牌 / 角色专属声音资产。
查看详情
U1-OCR
视觉
融合视觉与语义解析能力,具备完善文档处理能力,兼容多语种、手写及各类非标文档,可满足个人日常文件打理与企业文档数字化处理需求。
查看详情
U1-OCR-Med
视觉
专为医疗场景打造,适配病历、处方、检查报告、收费单据等各类医疗文档,可高效处理复杂医学表述与手写、印章等特殊场景,助力智慧医疗业务高效落地。
查看详情
与顶尖伙伴携手共创
深入产业,为 500+ 企业创造卓越价值











































