我越来越确信LangGraph胜过Claude插件
摘要
作者分享了构建一个用于股票估值的Claude插件的经验,发现处理错误和复杂性的难度越来越大。现在他们正考虑切换到LangGraph,作为多步骤智能体工作流的更可靠解决方案。
我花了三个月时间构建(并自以为完善)一个用于上市公司估值的Claude插件。它运行良好,能从SEC API获取数据,解析成结构化的JSON,研究场景并构建预测,最后计算公司的内在价值。大约90%的时间里,我没什么可抱怨的,老实说,刚开始时我对这些结果相当满意。构建插件时我估值的第一个公司,花了一个月才搞定。四家公司之后,现在估值一家公司大约需要一天。我发现在一天之内完成越来越困难。我像打地鼠一样处理出现的错误。我发现,仅仅在SKILL文件中明确告诉模型使用检查点(例如'确保此测试通过')并不可靠,而且随着插件变得越来越复杂,这种做法显得笨拙。如果Claude确实运行了测试,那没问题,但有时它一开始就忘记运行测试。现在我正将目光投向LangGraph作为我的解决方案。我想知道其他人是否有类似的经历,以及你们对LangGraph的看法?是否有我尚未想到的混合解决方案?
相似文章
LangGraph 代理和其他代理框架是否正在变得过时?
作者反思了构建许多 LangGraph 代理的经历,并质疑在新生成模型下它们的必要性,主张使用更简单的单代理方案,配合 MCP 工具和受控端点,而不是复杂的预定义框架。
@LangChain: 改进智能体 旧方法:手动读取追踪、寻找模式、编写评估、创建修复。更好的办法…
这条推文对比了改进AI智能体的旧手动方法与使用LangSmith Engine的新自动化方法,后者循环进行追踪、评估和修复。
在LangGraph上构建了一个确定性代理框架,其中评判门是结构性的,而非提示
一位开发者介绍了SPINE,这是一个基于LangGraph构建的确定性代理框架,它使用结构性评判门而非基于提示的护栏,并在工具层驱动行为,以实现更可靠的本地推理代理。
@hwchase17: "用 Deep Agents 构建你自己的 Claude Code" 社区的一篇好文章,展示了如何构建一个类似 Claude Code 的代理……
一篇解释如何使用 LangChain 的 Deep Agents 库构建类似 Claude Code 的编码代理的文章,涵盖了架构和实现。
在遇到 LangGraph 天花板后,我构建了自己的智能体运行时——将 UI 作为图节点,Postgres 持久化,零编排成本
作者介绍了 cascaide,这是一个全栈智能体运行时和 AI 编排框架,使用 TypeScript 编写,可在任何支持 JS/TS 的环境运行。它提供 UI 作为图节点、持久化 Postgres 检查点、零编排成本,并且设计为可自托管,无供应商锁定。