text-first

标签

Cards List
#text-first

释放全双工语音模型中LLM的能力

Hugging Face Daily Papers · 2026-05-04 缓存

提出Listen-Write-Speak (LWS),一种文本优先的三通道范式,允许单个自回归LLM持续监听、书写可见文本并实时说话,实现无需架构修改的全双工语音交互。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈