spoken-dialogue

标签

Cards List
#spoken-dialogue

口语对话中的上下文感知多模态声明验证

arXiv cs.CL · 2026-06-11 缓存

本文介绍了MAD2,一个用于口语对话中多模态声明验证的新基准,并提出了音频和文本模型的校准融合,利用对话上下文来提高验证准确性。

0 人收藏 0 人点赞
#spoken-dialogue

全双工语音对话模型中的同步与话轮转换

arXiv cs.CL · 2026-05-21 缓存

本文通过模拟两个Moshi模型实例之间的对话,利用CKA测量表征对齐并使用LSTM探针预测话轮边界,分析了全双工语音对话模型中的同步与话轮转换动态。

0 人收藏 0 人点赞
#spoken-dialogue

VoxMind:端到端智能体语音对话系统

Hugging Face Daily Papers · 2026-04-17 缓存

VoxMind 推出具备智能体能力的端到端语音对话系统,通过“先思后言”机制与动态工具管理,将任务完成率从 34.88% 提升到 74.57%,同时保持对话质量。

0 人收藏 0 人点赞
#spoken-dialogue

WavAlign:通过自适应混合后训练提升口语对话模型的智能与表现力

Hugging Face Daily Papers · 2026-04-16 缓存

WavAlign 提出一种模态感知的自适应后训练方法,利用受限偏好更新与显式锚定,在端到端口语对话模型中同步提升语义质量与语音表现力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈