字里行间:单向对话问题
摘要
本文介绍了单向对话问题(1SC),针对在远程医疗和呼叫中心等现实场景中,仅有一方发言转录的情况下,如何重建缺失的对话内容和生成摘要。作者在多个数据集上评估了提示和微调模型,发现访问未来上下文和话语长度信息能改进重建效果,同时无需完整对话重建即可生成高质量摘要。
查看缓存全文
缓存时间: 2026/04/20 08:31
# 字里行间:单向对话问题 来源:https://arxiv.org/abs/2511.03056 查看 PDF (https://arxiv.org/pdf/2511.03056) > 摘要:在许多现实应用中,对话式 AI 受到限制,因为只能记录对话的一方,如远程医疗、呼叫中心和智能眼镜。我们将这个问题形式化为单向对话问题(1SC):推断并从对话的一方学习。我们研究两个任务:(1)为实时用例重建缺失发言者的发言,以及(2)从单向对话记录生成摘要。通过在 MultiWOZ、DailyDialog 和 Candor 数据集上评估提示和微调模型,使用人工 A/B 测试和 LLM 作为评判的指标,我们发现:获取一个未来轮次和话语长度信息可以改进重建效果,占位符提示有助于减轻幻觉,虽然大型模型通过提示生成了有希望的重建结果,但较小的模型需要微调。此外,无需重建缺失轮次也能生成高质量摘要。我们将 1SC 呈现为一个新型挑战,并报告了有希望的结果,标志着朝着隐私保护型对话式 AI 迈出了一步。 ## 提交历史 来自:Victoria Ebert [查看邮箱 (https://arxiv.org/show-email/c68990da/2511.03056)] **[[v1]](https://arxiv.org/abs/2511.03056v1)** 2025 年 11 月 4 日星期二 22:53:57 UTC(513 KB)**[v2]** 2026 年 4 月 16 日星期四 17:48:38 UTC(9,889 KB)
相似文章
长期历史感知的医疗对话合成与评估
本文介绍了一种利用大语言模型(LLMs)合成长期医疗对话数据集的框架,并创建了 MediLongChat,包含三个基准任务,用于评估医疗智能体的记忆与推理能力。实验表明,即使是最先进的 LLMs 也难以完成这些任务。
全双工语音对话模型中的同步与话轮转换
本文通过模拟两个Moshi模型实例之间的对话,利用CKA测量表征对齐并使用LSTM探针预测话轮边界,分析了全双工语音对话模型中的同步与话轮转换动态。
单轮对话中多种支持策略的建模及其在情感支持对话中的应用
论文页面 - 单轮对话中多种支持策略的建模及其在情感支持对话中的应用 来源:[https://huggingface.co/papers/2604.17972](https://huggingface.co/papers/2604.17972) ## 摘要 多策略话语生成方法通过在单个回复中整合多种支持策略,优于单策略方法。情感支持对话(ESC)旨在通过生成移情性和支持性对话来帮助处于困境中的个体。
MTR-DuplexBench:全双工语音语言模型多轮对话的综合评估基准
MTR-DuplexBench为全双工语音语言模型在多轮对话中的评估引入了一个综合基准,解决轮转边界模糊和上下文不一致等挑战,同时评估对话特征、对话质量、指令遵循和安全性。
MTR-Suite:一个用于评估和合成对话检索基准的框架
介绍MTR-Suite,一个用于评估和合成对话检索基准的统一框架,具备基于LLM的审计器、用于成本效益对话生成的多智能体流水线,以及一个具有高区分度的基准。