Voxtral TTS

Voxtral TTS

AI工具

Mistral AI开源的40亿参数文本转语音模型,支持9种语言零样本语音克隆

💰 开源📱 api, cli👁 1 次浏览🔗 0 次点击📅 2026/4/1 收录

📖 详细介绍

Voxtral TTS 是 Mistral AI 于 2026 年 3 月发布的开源文本转语音模型。基于 40 亿参数架构,支持英语、法语、中文等 9 种语言。核心亮点包括:仅需 3-5 秒音频即可实现零样本语音克隆、90 毫秒超低首音延迟、6 倍实时生成速度。模型权重开放(Apache 2.0),可本地部署。适合企业级语音助手、客户服务、内容创作等场景。这是 Mistral 进军多模态 AI 的重要一步。

✅ 核心功能

  • 零样本语音克隆
  • 9种语言支持
  • 90ms超低延迟
  • 流式生成
  • 40亿参数
  • Apache 2.0开源