@jonasgeiping:我们训练模型的方式错了,这都是因为ChatGPT。即使日常使用的现代编码代理仍采用基于消息的…

X AI KOLs Following 论文

摘要

一篇新论文提出具有多并行流的LLM,以克服编码代理和聊天模型中基于单流消息交互的瓶颈,实现同时阅读、写作和推理。

我们训练模型的方式错了,这都是因为chatGPT。即使日常使用的现代编码代理仍采用基于消息的交互:它们向用户、向自己(CoT)和向工具发送消息,然后依次接收消息。这甚至将非常智能的代理限制在单一流中。模型无法在写作的同时阅读,无法在思考的同时行动,也无法在处理信息的同时思考。在我们的新论文中(见下文),我们讨论了具有并行流的LLM。我们展示了多流LLM可以……通过指令微调来创建流格式,简化用户和工具使用体验,消除代理和聊天模型中的许多痛点(例如必须打断模型才能插话)。多流LLM速度很快,它们可以在每次前向传播中并行预测+读取所有流的令牌,从而降低延迟。具有多个流的LLM更容易编码关注点分离,提高安全性。具有许多内部流的LLM提供了清晰的并行/连续推理形式。即使主CoT流意外受到压力或过于专注于特定任务而无法表达关切,其他内部流也可以内部表达那些否则无法言说的关切。这听起来是不是和最近一篇深思熟虑的帖子有关 :) - 是的,但我并不因为被他们抢先23小时发布这么酷的报告而感到太糟糕。我将在下面链接第二条推文,进行更直接的比较。我实际上认为两者在有趣的方面是互补的。
查看原文

相似文章

通过多模态突破纯文本瓶颈?

Reddit r/AI_Agents

本文讨论了多模态 AI 模型(如 GPT-4o 和 Claude 3.5 Sonnet)如何通过支持可视化调试、音频转数据以及增强型 RAG 系统,来克服纯文本处理的瓶颈。