spoken-dialogue

#spoken-dialogue

口语对话中的上下文感知多模态声明验证

arXiv cs.CL ↗ · 2026-06-11 缓存

本文介绍了MAD2，一个用于口语对话中多模态声明验证的新基准，并提出了音频和文本模型的校准融合，利用对话上下文来提高验证准确性。

0 人收藏 0 人点赞

#spoken-dialogue

arXiv cs.CL ↗ · 2026-05-21 缓存

本文通过模拟两个Moshi模型实例之间的对话，利用CKA测量表征对齐并使用LSTM探针预测话轮边界，分析了全双工语音对话模型中的同步与话轮转换动态。

0 人收藏 0 人点赞

#spoken-dialogue

Hugging Face Daily Papers ↗ · 2026-04-17 缓存

VoxMind 推出具备智能体能力的端到端语音对话系统，通过“先思后言”机制与动态工具管理，将任务完成率从 34.88% 提升到 74.57%，同时保持对话质量。

0 人收藏 0 人点赞

#spoken-dialogue

Hugging Face Daily Papers ↗ · 2026-04-16 缓存

WavAlign 提出一种模态感知的自适应后训练方法，利用受限偏好更新与显式锚定，在端到端口语对话模型中同步提升语义质量与语音表现力。

0 人收藏 0 人点赞