full-duplex-speech

标签

Cards List
#full-duplex-speech

释放全双工语音模型中LLM的能力

Hugging Face Daily Papers · 2026-05-04 缓存

提出Listen-Write-Speak (LWS),一种文本优先的三通道范式,允许单个自回归LLM持续监听、书写可见文本并实时说话,实现无需架构修改的全双工语音交互。

0 人收藏 0 人点赞
#full-duplex-speech

OmniFlatten:一种用于无缝语音对话的端到端 GPT 模型

Papers with Code Trending · 2024-10-23 缓存

OmniFlatten 是一种新颖的基于 GPT 的模型,通过一种多阶段后训练技术整合语音和文本,在不改变原始架构的情况下实现实时全双工语音对话。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈