@rohanpaul_ai: LLM 代理能否通过交互发现隐藏规则?答案令人不安。隐藏世界越复杂…

X AI KOLs Following 论文

摘要

本文研究了LLM代理是否可以通过交互推断隐藏的世界模型,发现随着复杂性的增加,它们难以构建稳定的内部模型。

LLM 代理能否通过交互发现隐藏规则? 答案令人不安。隐藏世界越复杂,AI 代理落后的速度就越快。 LLM 往往无法将不断积累的证据转化为稳定的内部模型。 当前的 LLM 代理有时可以通过交互发现隐藏结构,但在规划问题、使用记忆以及将反馈转化为可靠世界模型方面仍然薄弱。 ---- 链接 – arxiv.org/abs/2606.16576 标题:“Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning”
查看原文
查看缓存全文

缓存时间: 2026/06/22 07:32

LLM代理能否通过交互真正发现隐藏规则?

答案令人不安。隐藏世界的规则越复杂,AI代理落后的速度就越快。

LLM常常无法将不断积累的证据转化为稳定的内部模型。

当前的LLM代理有时能通过交互发现隐藏结构,但在规划提问、使用记忆以及将反馈转化为可靠世界模型方面仍然薄弱。


链接 – arxiv.org/abs/2606.16576

标题:“LLM代理能否推断世界模型?来自代理自动机学习的证据”

相似文章

@rohanpaul_ai: 斯坦福新论文指出,在同等推理预算下,单个LLM通常比多个……更好地解决多跳问题

X AI KOLs Timeline

一项新的斯坦福论文显示,在同等推理token预算下,单个LLM在多跳推理任务上通常优于多智能体系统,而多智能体设置带来的提升往往来自更多计算而非架构优势。该论文利用数据处理不等式解释为什么交接中的信息丢失会损害多智能体性能,并指出上下文质量是多智能体系统能够提供益处的关键因素。

在复杂隐藏角色游戏中评估大型语言模型

arXiv cs.CL

本文介绍了一个开源框架,用于评估大型语言模型在隐藏角色游戏《秘密希特勒》中的推理、说服和欺骗能力。研究发现,当前模型在持续的多轮操纵上表现不佳,而基于规则的智能体优于它们。

LLMs 并非你所认为的黑箱

Hacker News Top

一篇总结 Anthropic 2025 年关于机制可解释性论文的文章,表明 LLM 并非黑箱,电路追踪可以揭示多步推理和人类可识别的概念。