agent-development

标签

Cards List
#agent-development

@eyad_khrais: https://x.com/eyad_khrais/status/2069552027382980882

X AI KOLs Timeline · 14小时前 缓存

一份构建 AI 代理框架的全面指南,涵盖工具执行、上下文管理、状态/记忆和护栏,基于构建 Claude Code 和其他企业级框架的经验。

0 人收藏 0 人点赞
#agent-development

我尝试将BEAM风格的并发模型应用于代码智能体——结果令人惊讶

Reddit r/AI_Agents · 23小时前

一项将BEAM风格并发(Erlang VM模型)应用于代码智能体的实验得到了令人惊讶的结果,暗示了在智能体协调和容错方面的潜在改进。

0 人收藏 0 人点赞
#agent-development

你实际上是如何为AI代理构建审批门的?我确信大多数都只是形同虚设

Reddit r/AI_Agents · 昨天

作者认为,许多针对AI代理的人工审批门效果不佳,如同虚设;并提出了一个框架,用于设计能够真正捕捉错误的有意义的审查机制。

0 人收藏 0 人点赞
#agent-development

@sydneyrunkle: 人们想要构建智能体,并且希望它简单易用。更重要的是,你的智能体应该易于改进……

X AI KOLs Following · 2天前 缓存

人们想要轻松构建智能体,并使其随时间改进;自动化“爬山”循环虽然困难,但投资回报率很高。

0 人收藏 0 人点赞
#agent-development

@googledevs: Most agent demos are stateless. Ask → answer → context gone. Production agents need to run for days — pausing, resuming…

X AI KOLs Following · 2026-06-11 缓存

Google Devs introduces Agent Factory series with ADK 2.0 and Gemini 3.5 Flash, demonstrating how to build production-grade stateful agents that can run for days, featuring insights on skills, MCP, and code review strategies from engineers like Rohde Davis.

0 人收藏 0 人点赞
#agent-development

@zachlloydtweets: https://x.com/zachlloydtweets/status/2065154860337508577

X AI KOLs Timeline · 2026-06-11 缓存

这篇文章概述了一个使用Warp技能的规范驱动开发的五步工作流程:编写产品规范(PRODUCT.md),编写技术规范(TECH.md),使用任何AI代理进行实现,验证实现与规范一致,以及使用Oz进行计算机使用验证。这些技能是开源的,可以通过npx安装。

0 人收藏 0 人点赞
#agent-development

智能体应该是代码还是带有独立运行时的声明式实体?

Reddit r/AI_Agents · 2026-06-08

作者认为,生产环境中的AI智能体应定义为具有独立运行时的声明式清单,而不是分散在应用代码中,以便实现适当的版本控制、可观测性和回滚。他们将自己的解决方案作为开源工具提供。

0 人收藏 0 人点赞
#agent-development

@sairahul1: https://x.com/sairahul1/status/2063544956158185927

X AI KOLs Timeline · 2026-06-07 缓存

本文介绍了“Harness Engineering”这一概念,这是一门专注于设计约束和引导AI代理的系统,使其在生产中可靠的学科,并认为Harness(约束系统)比模型本身更重要。

0 人收藏 0 人点赞
#agent-development

AI智能体的执行质量在多大程度上实际上是一个数据问题?

Reddit r/AI_Agents · 2026-06-05

作者反思了为什么在演示中表现良好的AI智能体在实际工作流中经常失败,认为执行质量可能更多地与数据问题(任务示例、工具轨迹、评估集)相关,而不仅仅是推理或规划,并指出他们正在通过OpenDCAI/DataFlow项目探索这个问题。

0 人收藏 0 人点赞
#agent-development

@googledevs: 智能体开发正在向前推进。传统上,生产扩展需要手动基础设施设置和…

X AI KOLs Following · 2026-06-04 缓存

Google宣布在Gemini API中正式推出Managed Agents,实现零基础设施开销的智能体开发。文章还重点介绍了AGENTS.md,这是一种为AI编码智能体提供上下文的开放格式,已被超过6万个开源项目采用。

0 人收藏 0 人点赞
#agent-development

元智能体挑战:当前智能体能否自主开发智能体系统?

Hugging Face Daily Papers · 2026-06-03 缓存

本文介绍了元智能体挑战(MAC),这是一个用于评估AI模型通过迭代编程自主开发智能体系统能力的基准测试。结果表明,当前模型很少能达到人类基线水平,且表现出奖励破解等问题,凸显了自我改进能力上的不足。

0 人收藏 0 人点赞
#agent-development

@0xenderzcx: https://x.com/0xenderzcx/status/2061778310934516097

X AI KOLs Timeline · 2026-06-02 缓存

作者创建了 pi-docs-playbook 仓库,将 pi 框架官方文档分类整理,以便 coding agent(如 Codex/Claude)高效、准确地读取,从而辅助构建业务 Agent,减少幻觉。

0 人收藏 0 人点赞
#agent-development

@LangChain: 托管深度代理保持您已经熟悉的项目结构:↳ AGENTS.md、skills/、subagents/ 和 tools.json Context Hub…

X AI KOLs Timeline · 2026-06-01 缓存

LangChain 推出了托管深度代理(Managed Deep Agents),保持了熟悉的项目布局:AGENTS.md、skills/、subagents/ 和 tools.json,并提供了 Context Hub 用于跨会话的持久上下文管理。

0 人收藏 0 人点赞
#agent-development

MCP 真的能减少智能体的集成工作量吗?

Reddit r/AI_Agents · 2026-05-31

本文探讨了模型上下文协议(MCP)是否通过标准化智能体与工具的通信,有效减少了 AI 智能体的集成工作量,并将 Evose 中的原生 MCP 集成与 LangGraph、CrewAI 等其他技术栈中的手动连接进行了比较。

0 人收藏 0 人点赞
#agent-development

我将 wikiLLM 改造为“智能体即开发者”用例——以下是改动内容及原因

Reddit r/AI_Agents · 2026-05-30

一位没有机器学习背景的产品经理将 wikiLLM 改造为“智能体即开发者”,使其能够在遇到意外情况时自动生成上下文,并将重复出现的模式升级为经过验证的规则,从而将强制上下文减少约 80%,并避免重复处理已解决的问题。

0 人收藏 0 人点赞
#agent-development

@LangChain: https://x.com/LangChain/status/2060111005917577668

X AI KOLs Following · 2026-05-28 缓存

LangChain 的新闻通讯宣布了 Interrupt 2026 的重大产品发布:用于自动诊断和修复 Agent 故障的 LangSmith Engine,以及用于安全代码执行的 Sandboxes 正式版,同时还启动了新的 LangChain Labs 研究计划,并预告了即将举行的活动。

0 人收藏 0 人点赞
#agent-development

@GitTrend0x: Hermes 谁用谁舒服!超级应用研发! 强化 fork 版、阿里云记忆插件、Felo 营销技能包、Awesome 社区圣经、轻量 Web UI…… 全网程序员把 Hermes 玩成了下一代 Agent 深度 hack 神器 + 云端集体…

X AI KOLs Timeline · 2026-05-23 缓存

Hermes Agent及其生态工具集在开发者社区中引发关注,包括强化fork版、阿里云记忆插件、Felo技能包、社区圣经和轻量Web UI,展示了AI Agent的深度定制和云端协作能力。

0 人收藏 0 人点赞
#agent-development

@wsl8297: 微软开源了一个更顺手的 VS Code 插件:AI Toolkit,把 Agent 应用开发从搭环境到评估上线,一口气打通。 一个界面就够:模型挑选、Playground 试跑、Agent 搭建、批量对比、指标评测,全都集成在一起。 Gi…

X AI KOLs Timeline · 2026-05-16 缓存

微软开源了 VS Code 插件 AI Toolkit,将模型选择、Playground、Agent 搭建、批量测试和评估集成在一个界面中,简化 AI Agent 开发流程。

0 人收藏 0 人点赞
#agent-development

@LangChain:减少分类时间,更快修复,更早发现回归。介绍LangSmith Engine:一个能够自动工作的智能体……

X AI KOLs Following · 2026-05-13 缓存

LangChain 推出 LangSmith Engine 公测版,这是一个自主智能体,能够监控生产追踪、聚类故障、诊断根本原因,并提出修复和评估覆盖建议,以简化智能体开发。

0 人收藏 0 人点赞
#agent-development

@zeuuss_01: 本周阅读了 40 个 SKILL.md 文件。其中 33 个的描述永远无法触发……它们都有同样的错误。技能本身没问题。描述却是死代码。技能不是按文件名加载的,它们是在描述命中用户刚输入的关键词时加载的。宣传册文案——隐形。五个修复方案 1. 将描述写成触发映射表:停止描述技能做什么,开始列举用户会说的话 > 文件类型:docx、.docx、Word 文档 > 动词:创建、编辑、填写、遮盖、转换 > 交付物:备忘录、合同、报告、信函 > 否定词:不适用于 PDF,不适用于 Google 文档。如果真实用户请求中不包含这三个词中的三个,该技能就是不可见的 2. 针对真实提示词而非合成提示词进行测试:从你过去一周的 Claude 使用记录中提取 20 条消息。将每条消息粘贴到已安装该技能的空白聊天窗口中 > 0/20 - 从头重写 > 5/20 - 缺少动词或文件扩展名 > 15/20 - 可以发布 > 20/20 - 过度拟合,会抢走不相关的任务。测试你实际写过的文本,而不是为了让技能看起来好而写的提示词 3. 添加负向空间:大多数技能被禁用是因为错误触发,而不是因为没有触发 > 不要用于 PDF > 不要用于 Google 表格 > 仅在用户写作时触发,阅读时不要触发 > 如果交付物是 Notion 页面,不要触发。否定词占描述的一半 4. 精简正文:在 SKILL.md 中,任何不会改变 Claude 行为的內容都是累赘。删除:> 使命声明 > "这个技能帮助你..." > 通用的 AI 建议 > 任何 Claude 已经知道的内容 > 像 README 一样的引言段落。剩下的应该像给新员工的一页纸指南 5. 对描述进行版本控制,而不是对正文进行版本控制:描述是路由器唯一能看到的东西。在技能旁边保留一个 descriptions.md:> 你尝试过的每个变体 > 日期 > 0/20 - 20/20 的评分 > 改变了什么。你会迭代描述的频率是正文的 10 倍。追踪它……正文回答“我该如何做”,而描述回答“这甚至是不是我的工作”。

X AI KOLs Following · 2026-05-10

本文提供了优化 Claude 的 SKILL.md 描述以确保正确触发激活的实用建议,强调具体关键词、负向约束和迭代测试的重要性,而非通用文档。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈