agent-development

#agent-development

@eyad_khrais: https://x.com/eyad_khrais/status/2069552027382980882

X AI KOLs Timeline ↗ · 6小时前缓存

一份构建 AI 代理框架的全面指南，涵盖工具执行、上下文管理、状态/记忆和护栏，基于构建 Claude Code 和其他企业级框架的经验。

0 人收藏 0 人点赞

#agent-development

我尝试将BEAM风格的并发模型应用于代码智能体——结果令人惊讶

Reddit r/AI_Agents ↗ · 15小时前

一项将BEAM风格并发（Erlang VM模型）应用于代码智能体的实验得到了令人惊讶的结果，暗示了在智能体协调和容错方面的潜在改进。

0 人收藏 0 人点赞

#agent-development

你实际上是如何为AI代理构建审批门的？我确信大多数都只是形同虚设

Reddit r/AI_Agents ↗ · 20小时前

作者认为，许多针对AI代理的人工审批门效果不佳，如同虚设；并提出了一个框架，用于设计能够真正捕捉错误的有意义的审查机制。

0 人收藏 0 人点赞

#agent-development

@sydneyrunkle: 人们想要构建智能体，并且希望它简单易用。更重要的是，你的智能体应该易于改进……

X AI KOLs Following ↗ · 2天前缓存

人们想要轻松构建智能体，并使其随时间改进；自动化“爬山”循环虽然困难，但投资回报率很高。

0 人收藏 0 人点赞

#agent-development

@googledevs: Most agent demos are stateless. Ask → answer → context gone. Production agents need to run for days — pausing, resuming…

X AI KOLs Following ↗ · 2026-06-11 缓存

Google Devs introduces Agent Factory series with ADK 2.0 and Gemini 3.5 Flash, demonstrating how to build production-grade stateful agents that can run for days, featuring insights on skills, MCP, and code review strategies from engineers like Rohde Davis.

0 人收藏 0 人点赞

#agent-development

@zachlloydtweets: https://x.com/zachlloydtweets/status/2065154860337508577

X AI KOLs Timeline ↗ · 2026-06-11 缓存

这篇文章概述了一个使用Warp技能的规范驱动开发的五步工作流程：编写产品规范（PRODUCT.md），编写技术规范（TECH.md），使用任何AI代理进行实现，验证实现与规范一致，以及使用Oz进行计算机使用验证。这些技能是开源的，可以通过npx安装。

0 人收藏 0 人点赞

#agent-development

智能体应该是代码还是带有独立运行时的声明式实体？

Reddit r/AI_Agents ↗ · 2026-06-08

作者认为，生产环境中的AI智能体应定义为具有独立运行时的声明式清单，而不是分散在应用代码中，以便实现适当的版本控制、可观测性和回滚。他们将自己的解决方案作为开源工具提供。

0 人收藏 0 人点赞

#agent-development

@sairahul1: https://x.com/sairahul1/status/2063544956158185927

X AI KOLs Timeline ↗ · 2026-06-07 缓存

本文介绍了“Harness Engineering”这一概念，这是一门专注于设计约束和引导AI代理的系统，使其在生产中可靠的学科，并认为Harness（约束系统）比模型本身更重要。

0 人收藏 0 人点赞

#agent-development

AI智能体的执行质量在多大程度上实际上是一个数据问题？

Reddit r/AI_Agents ↗ · 2026-06-05

作者反思了为什么在演示中表现良好的AI智能体在实际工作流中经常失败，认为执行质量可能更多地与数据问题（任务示例、工具轨迹、评估集）相关，而不仅仅是推理或规划，并指出他们正在通过OpenDCAI/DataFlow项目探索这个问题。

0 人收藏 0 人点赞

#agent-development

@googledevs: 智能体开发正在向前推进。传统上，生产扩展需要手动基础设施设置和…

X AI KOLs Following ↗ · 2026-06-04 缓存

Google宣布在Gemini API中正式推出Managed Agents，实现零基础设施开销的智能体开发。文章还重点介绍了AGENTS.md，这是一种为AI编码智能体提供上下文的开放格式，已被超过6万个开源项目采用。

0 人收藏 0 人点赞

#agent-development

元智能体挑战：当前智能体能否自主开发智能体系统？

Hugging Face Daily Papers ↗ · 2026-06-03 缓存

本文介绍了元智能体挑战（MAC），这是一个用于评估AI模型通过迭代编程自主开发智能体系统能力的基准测试。结果表明，当前模型很少能达到人类基线水平，且表现出奖励破解等问题，凸显了自我改进能力上的不足。

0 人收藏 0 人点赞

#agent-development

@0xenderzcx: https://x.com/0xenderzcx/status/2061778310934516097

X AI KOLs Timeline ↗ · 2026-06-02 缓存

作者创建了 pi-docs-playbook 仓库，将 pi 框架官方文档分类整理，以便 coding agent（如 Codex/Claude）高效、准确地读取，从而辅助构建业务 Agent，减少幻觉。

0 人收藏 0 人点赞

#agent-development

@LangChain: 托管深度代理保持您已经熟悉的项目结构：↳ AGENTS.md、skills/、subagents/ 和 tools.json Context Hub…

X AI KOLs Timeline ↗ · 2026-06-01 缓存

LangChain 推出了托管深度代理（Managed Deep Agents），保持了熟悉的项目布局：AGENTS.md、skills/、subagents/ 和 tools.json，并提供了 Context Hub 用于跨会话的持久上下文管理。

0 人收藏 0 人点赞

#agent-development

MCP 真的能减少智能体的集成工作量吗？

Reddit r/AI_Agents ↗ · 2026-05-31

本文探讨了模型上下文协议（MCP）是否通过标准化智能体与工具的通信，有效减少了 AI 智能体的集成工作量，并将 Evose 中的原生 MCP 集成与 LangGraph、CrewAI 等其他技术栈中的手动连接进行了比较。

0 人收藏 0 人点赞

#agent-development

我将 wikiLLM 改造为“智能体即开发者”用例——以下是改动内容及原因

Reddit r/AI_Agents ↗ · 2026-05-30

一位没有机器学习背景的产品经理将 wikiLLM 改造为“智能体即开发者”，使其能够在遇到意外情况时自动生成上下文，并将重复出现的模式升级为经过验证的规则，从而将强制上下文减少约 80%，并避免重复处理已解决的问题。

0 人收藏 0 人点赞

#agent-development

@LangChain: https://x.com/LangChain/status/2060111005917577668

X AI KOLs Following ↗ · 2026-05-28 缓存

LangChain 的新闻通讯宣布了 Interrupt 2026 的重大产品发布：用于自动诊断和修复 Agent 故障的 LangSmith Engine，以及用于安全代码执行的 Sandboxes 正式版，同时还启动了新的 LangChain Labs 研究计划，并预告了即将举行的活动。

0 人收藏 0 人点赞

#agent-development

@GitTrend0x: Hermes 谁用谁舒服！超级应用研发！强化 fork 版、阿里云记忆插件、Felo 营销技能包、Awesome 社区圣经、轻量 Web UI…… 全网程序员把 Hermes 玩成了下一代 Agent 深度 hack 神器 + 云端集体…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

Hermes Agent及其生态工具集在开发者社区中引发关注，包括强化fork版、阿里云记忆插件、Felo技能包、社区圣经和轻量Web UI，展示了AI Agent的深度定制和云端协作能力。

0 人收藏 0 人点赞

#agent-development

@wsl8297: 微软开源了一个更顺手的 VS Code 插件：AI Toolkit，把 Agent 应用开发从搭环境到评估上线，一口气打通。一个界面就够：模型挑选、Playground 试跑、Agent 搭建、批量对比、指标评测，全都集成在一起。 Gi…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

微软开源了 VS Code 插件 AI Toolkit，将模型选择、Playground、Agent 搭建、批量测试和评估集成在一个界面中，简化 AI Agent 开发流程。

0 人收藏 0 人点赞

#agent-development

@LangChain：减少分类时间，更快修复，更早发现回归。介绍LangSmith Engine：一个能够自动工作的智能体……

X AI KOLs Following ↗ · 2026-05-13 缓存

LangChain 推出 LangSmith Engine 公测版，这是一个自主智能体，能够监控生产追踪、聚类故障、诊断根本原因，并提出修复和评估覆盖建议，以简化智能体开发。

0 人收藏 0 人点赞

#agent-development

@zeuuss_01: 本周阅读了 40 个 SKILL.md 文件。其中 33 个的描述永远无法触发……它们都有同样的错误。技能本身没问题。描述却是死代码。技能不是按文件名加载的，它们是在描述命中用户刚输入的关键词时加载的。宣传册文案——隐形。五个修复方案 1. 将描述写成触发映射表：停止描述技能做什么，开始列举用户会说的话 > 文件类型：docx、.docx、Word 文档 > 动词：创建、编辑、填写、遮盖、转换 > 交付物：备忘录、合同、报告、信函 > 否定词：不适用于 PDF，不适用于 Google 文档。如果真实用户请求中不包含这三个词中的三个，该技能就是不可见的 2. 针对真实提示词而非合成提示词进行测试：从你过去一周的 Claude 使用记录中提取 20 条消息。将每条消息粘贴到已安装该技能的空白聊天窗口中 > 0/20 - 从头重写 > 5/20 - 缺少动词或文件扩展名 > 15/20 - 可以发布 > 20/20 - 过度拟合，会抢走不相关的任务。测试你实际写过的文本，而不是为了让技能看起来好而写的提示词 3. 添加负向空间：大多数技能被禁用是因为错误触发，而不是因为没有触发 > 不要用于 PDF > 不要用于 Google 表格 > 仅在用户写作时触发，阅读时不要触发 > 如果交付物是 Notion 页面，不要触发。否定词占描述的一半 4. 精简正文：在 SKILL.md 中，任何不会改变 Claude 行为的內容都是累赘。删除：> 使命声明 > "这个技能帮助你..." > 通用的 AI 建议 > 任何 Claude 已经知道的内容 > 像 README 一样的引言段落。剩下的应该像给新员工的一页纸指南 5. 对描述进行版本控制，而不是对正文进行版本控制：描述是路由器唯一能看到的东西。在技能旁边保留一个 descriptions.md：> 你尝试过的每个变体 > 日期 > 0/20 - 20/20 的评分 > 改变了什么。你会迭代描述的频率是正文的 10 倍。追踪它……正文回答“我该如何做”，而描述回答“这甚至是不是我的工作”。

X AI KOLs Following ↗ · 2026-05-10

本文提供了优化 Claude 的 SKILL.md 描述以确保正确触发激活的实用建议，强调具体关键词、负向约束和迭代测试的重要性，而非通用文档。

0 人收藏 0 人点赞

agent-development

提交意见反馈