@a1zhang：等等，这太酷了 LOL。理论上，如果我们对RLMs进行hillclimb（爬山算法），它们可能会被激励以这种方式启动代码块。

X AI KOLs Following 2026/06/10 21:44 论文

multi-agent decentralized language-models rlms hillclimbing asynchronous coordination

摘要

一条推文强调了通过hillclimb（爬山算法）RLMs来激励启动代码块的潜力，并引用了一种新的去中心化语言模型（DeLM）方法，其中多个智能体通过共享上下文进行异步协调。

等等，这太酷了 LOL 理论上，如果我们对RLMs进行hillclimb（爬山算法），它们可能会被激励以这种方式启动代码块 https://t.co/HP0evnxCrt

查看原文

查看缓存全文

缓存时间: 2026/06/10 21:55

等等，这太酷了 LOL

理论上，如果我们对RLM进行爬山优化，或许它们会被激励以这种方式启动代码块 https://t.co/HP0evnxCrt

Yuzhen Mao (@Mao_Yuzhen): 当多智能体系统不再依赖中央“控制器”智能体时，会发生什么？智能体能否通过直接共享结果来进行协调？

引入去中心化语言模型（DeLM）：我们让智能体通过共享上下文进行异步协调。智能体索取

相似文章

X AI KOLs Following

Azalia Mirhoseini 强调 DeLM，一种去中心化语言模型方法，其中智能体通过共享状态通信，在SWE-bench Verified上使用Gemini-3 Flash实现了约10%的提升，且成本不到一半。

X AI KOLs Timeline

LangChain的循环工程手册通过四个嵌套循环（代理循环、验证循环、事件驱动循环和爬山循环）替代了提示工程，使AI代理能够随着时间的推移自动自我改进。该文章认为，构建自我优化循环如今已成为关键的竞争优势，而非使用更先进的模型。

X AI KOLs Following

一位开发者分享了一个有趣的案例：在浏览器中运行LLM以检查其内部工作原理，强调了客户端AI的一个有意义场景。

X AI KOLs Timeline

Harrison Chase 发布了一个名为 code interpreter 的轻量级代码执行环境，它支持 RLMs 和程序化工具调用，无需启动完整的沙箱，更多用例将陆续公布。

GitHub Trending (daily)

递归语言模型（RLMs）引入了一种与任务无关的推理范式，使语言模型能够通过递归地在输入上调用自身来处理近乎无限的上下文，同时还提供了配套的开源推理引擎和训练环境。