专题:dialect

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体量子位2026/04/08 14:105870
VoxCPM 2:2 B 参数多方言多语言语音模型
采用扩散自回归连续表征,实现秒级高保真合成

VoxCPM 2 是面壁智能推出的 2 B 参数开源语音模型,支持九种中文方言和三十种外语,具备音色可控、48 kHz 高保真和秒级生成等特性。其核心采用扩散自回归连续表征的 Tokenizer‑Free 架构,能够在保持情感与细节的同时实现快速合成。模型已全量开源并提供在线体验,适用于配音、游戏、动画等多场景。