@jonasgeiping：我们训练模型的方式错了，这都是因为ChatGPT。即使日常使用的现代编码代理仍采用基于消息的…

X AI KOLs Following 2026/05/13 16:31 论文

llm parallel-streams multi-stream language-models agents research

摘要

一篇新论文提出具有多并行流的LLM，以克服编码代理和聊天模型中基于单流消息交互的瓶颈，实现同时阅读、写作和推理。

我们训练模型的方式错了，这都是因为chatGPT。即使日常使用的现代编码代理仍采用基于消息的交互：它们向用户、向自己（CoT）和向工具发送消息，然后依次接收消息。这甚至将非常智能的代理限制在单一流中。模型无法在写作的同时阅读，无法在思考的同时行动，也无法在处理信息的同时思考。在我们的新论文中（见下文），我们讨论了具有并行流的LLM。我们展示了多流LLM可以……通过指令微调来创建流格式，简化用户和工具使用体验，消除代理和聊天模型中的许多痛点（例如必须打断模型才能插话）。多流LLM速度很快，它们可以在每次前向传播中并行预测+读取所有流的令牌，从而降低延迟。具有多个流的LLM更容易编码关注点分离，提高安全性。具有许多内部流的LLM提供了清晰的并行/连续推理形式。即使主CoT流意外受到压力或过于专注于特定任务而无法表达关切，其他内部流也可以内部表达那些否则无法言说的关切。这听起来是不是和最近一篇深思熟虑的帖子有关 :) - 是的，但我并不因为被他们抢先23小时发布这么酷的报告而感到太糟糕。我将在下面链接第二条推文，进行更直接的比较。我实际上认为两者在有趣的方面是互补的。

查看原文

@jonasgeiping：我们训练模型的方式错了，这都是因为ChatGPT。即使日常使用的现代编码代理仍采用基于消息的…

相似文章

Multi-Stream LLMs：关于并行/分离提示、思考、I/O的新论文

多流大语言模型：通过并行思维、输入与输出流解锁语言模型的潜力

@shabnam_774: https://x.com/shabnam_774/status/2058517919760355729

通过多模态突破纯文本瓶颈？

@joelhooks：“几十个智能体”听起来有点疯狂，也确实有点，但当你开始思考“循环”时，就开始说得通了……

提交意见反馈