为什么所有构建的智能体都只是更差的Claude Code?

Reddit r/AI_Agents 新闻

摘要

一位开发者质疑构建专用AI智能体的价值,因为像Claude Code这样的通用工具也能完成同样的任务,他认为当前的智能体方法不过是能力更弱、加了额外护栏的Claude版本。

过去几周,我一直在负责构建一个开放式的智能体解决方案,我有点抓狂,需要一些现实检验。将Claude定义为一个功能强大的工具集,Claude Code目前可能是最好的,但你可以用自己觉得最好的来替代。基本上,我忍不住认为,每一个被创建出来的智能体,其实都只是能力更弱、在数据上加了护栏的Claude。举个简单的例子:一个编排智能体、一个数据库智能体和一个知识智能体(能访问内部知识,如PDF、向量数据库等)。要实现这个,你必须定义每个智能体的能力。编排智能体需要制定结构化计划,数据库智能体需要编写并执行SQL查询,知识智能体则要操作向量数据库并遍历Markdown文件。这本身运行得不错,但Claude Code通过`/goal`就能完成所有这些。它可能需要多几个周期来探索数据库模式或找到Markdown文件,但最终都能搞定。那么,通过`tools=[]`来定义智能体的能力还有什么意义呢?我想,这或许只是为了限制它迭代解决方案的周期,而这些方案本可以通过工具快捷地完成?仅此而已?我对此越来越困惑。在我看来,无论问题多么抽象和复杂,都可以分解成一个DAG(有向无环图),其中每个节点都是一个任务,Claude Code都能解决(假设它在计算机上,并且排除一些人在回路中的限制)。问题真的只是任务分解吗?这个分解问题真的那么难吗?我能感觉到自己一天天被讽刺所侵蚀,因为我的任务就是用Claude Code创建另一个智能体工作流,而这个工作流的功能还不如Claude Code本身,哈哈。
查看原文

相似文章

深入Claude Code:当前与未来AI代理系统的设计空间

Hugging Face Daily Papers

本文分析了Claude Code作为代理编程工具的架构,识别出影响其实现的五种人类价值观和十三项设计原则,包括安全系统、上下文管理和可扩展机制。研究将Claude Code与OpenClaw进行比较,展示了不同的部署环境如何针对常见的AI代理设计挑战产生不同的架构解决方案。

@shao__meng: Claude Code、Cursor、Codex、Aider、Cline 部分底层模型可能完全相同,但 Agent 表现却不一样,为什么? @addyosmani 认为:是因为模型之上的那层“外壳” —— Harness,它包括「提示词、…

X AI KOLs Timeline

The article discusses how Addy Osmani argues that the performance difference between AI coding agents like Claude Code, Cursor, and Cline stems from their 'Harness'—the layer of prompts, tools, and constraints around the model—rather than the underlying model itself. It details best practices for harness engineering, including hooks, sandboxing, and context management, to bridge the gap between model capability and actual agent performance.

Claude不是你的架构师。别再让它假装了

Hacker News Top

这篇评论文章尖锐指出,类似Claude的AI智能体缺乏真正软件架构所需的上下文判断力和说“不”的能力,警告人们不要让它们在缺乏人类监督的情况下设计系统。