conversation

#conversation

测试了小模型在对话中能记住一个事实多长时间。记忆失败模式对智能体来说是一个真正的问题，而且这并非我所预料的。

Reddit r/AI_Agents ↗ · 4小时前

一位开发者测试了小型边缘模型（LFM2.5、Gemma 变体）在多个对话轮次中保持一个事实的能力，发现模型常常自信地否认知道仍在上下文中的信息，这给智能体架构带来了信任问题，并暗示了记忆与格式规范之间的权衡。

0 人收藏 0 人点赞

#conversation

LANTERN：分层归档与时序情景检索网络，用于长上下文LLM对话

arXiv cs.CL ↗ · 3天前缓存

LANTERN 引入了一个轻量级记忆层，能够在对话压缩后归档对话轮次并检索相关细节，恢复了78.3%丢失的事实，且无需任何LLM调用，性能优于基于MemGPT的方法。

0 人收藏 0 人点赞

#conversation

@JeffDean: 感谢 @twominutepapers 的精彩对话，Károly！

X AI KOLs Following ↗ · 6天前缓存

Jeff Dean 感谢 Two Minute Papers 主持人进行了一场关于 AI 研究的对话，并在帖子中附带了完整视频的链接。

0 人收藏 0 人点赞

#conversation

@OpenAI：与OpenAI的@markchen90对话中，陶哲轩思考了一个未来，人工智能减少研究的认知摩擦……

X AI KOLs ↗ · 2026-05-29 缓存

陶哲轩与Mark Chen讨论了人工智能如何改变数学研究，从文献搜索到代码生成，以及调整工作流程的必要性。

0 人收藏 0 人点赞

#conversation

与 Opus 4.8 对话的感觉如何...

Reddit r/singularity ↗ · 2026-05-29

一位用户分享了与 Opus 4.8（一款AI语言模型）交流的第一手体验和感受。

0 人收藏 0 人点赞

#conversation

SeDT: Sentence-Transformer Decision-Transformer条件化用于多轮对话可靠性

arXiv cs.CL ↗ · 2026-05-27 缓存

本文介绍了SeDT，一种无需训练、推理时的方法，通过用来自三种信号的累积相关性分数标注对话历史，提高多轮对话中LLM的可靠性，在Lost-in-Conversation基准测试上实现了高达+37.7%的性能提升。

0 人收藏 0 人点赞

#conversation

Found in Conversation: LLMs 自我学习以缩小多轮对话差距

arXiv cs.CL ↗ · 2026-05-26 缓存

本文介绍了 Found in Conversation (FiC)，一个使用视图非对称自蒸馏（View-Asymmetric Self-Distillation）的训练框架，旨在缩小 LLMs 中的多轮对话性能差距。该方法教会模型从欠详细的多轮提示中恢复单轮能力，在多种模型系列和规模上实现了 92-100% 的恢复率。

0 人收藏 0 人点赞

#conversation

手语对话中的情感识别

arXiv cs.CL ↗ · 2026-05-25 缓存

本文介绍了用于手语对话情感识别的eJSL Dialog数据集，填补了现有数据集缺乏对话上下文的空白。基准测试表明，应用通用多模态模型时存在领域差距，凸显了针对手语的上下文感知视觉提取器的必要性。

0 人收藏 0 人点赞

conversation

提交意见反馈