NVIDIA PersonaPlex

NVIDIA PersonaPlex

AI工具

NVIDIA开源的全双工语音对话模型,170ms延迟实现边听边说

💰 开源📱 api, cli, linux👁 1 次浏览🔗 0 次点击📅 2026/4/7 收录

📖 详细介绍

PersonaPlex 是 NVIDIA 开源的 7B 参数实时语音对话模型,实现了真正的全双工通信——AI 可以边听边说,支持自然打断和停顿处理,响应延迟仅 170-265ms。采用神经编解码器对连续音频流进行编码,同时预测文本和语音 token。独特的混合提示系统支持通过文本描述角色性格+音频样本克隆声音来定制任意 AI 人格。在对话流畅度基准测试中大幅超越 Gemini Live(流畅轮换 90.8% vs 65.5%)和 Moshi。100% 开源(Apache-2.0),支持本地部署。GitHub 获得 7,300+ Star 且增长迅猛。

✅ 核心功能

  • 全双工语音
  • 170ms延迟
  • 角色声音定制
  • 自然打断处理
  • 超越Gemini Live
  • Apache 2.0开源