agent-workflows

#agent-workflows

SKILL.nb: 选择性形式化与门控执行用于持久化智能体工作流

arXiv cs.AI ↗ · 22小时前缓存

介绍了SKILL.nb，一个通过证据校准的生命周期策略来管理可复用智能体工作流的框架，具有选择性形式化和门控条件执行等特点。在网页自动化基准测试中取得了显著改进，并展示了对环境漂移的鲁棒性。

0 人收藏 0 人点赞

#agent-workflows

@GitTrend0x: Hermes 效率瞬间提升百倍！ NVIDIA NemoClaw 社区安全沙箱、last30days 跨平台研究技能、TheAiSingularity 硬件强制沙箱版、AaronWong1999 WeChat 桥接、stevibe 真实运…

X AI KOLs Timeline ↗ · 昨天缓存

NVIDIA's NemoClaw Community provides a collection of example blueprints for building constrained, inspectable agent workflows, combining the Hermes model, agent harness, and OpenShell sandbox for production-safe agent deployment.

0 人收藏 0 人点赞

#agent-workflows

我一直在为智能体重复构建检查点、重试和运行跟踪。所以我围绕它们构建了一个开源运行时。

Reddit r/AI_Agents ↗ · 昨天

作者构建了 Tidebase，一个用于智能体工作流的开源运行时，它使用 Postgres 提供检查点、重试和实时运行状态跟踪，使失败的运行可以从中断处恢复。

0 人收藏 0 人点赞

#agent-workflows

Lean4Agent: 代理工作流与轨迹的形式化建模与验证

arXiv cs.AI ↗ · 昨天缓存

介绍Lean4Agent，一个使用Lean4对代理工作流和轨迹进行形式化建模与验证的框架，展示了在SWE-Bench和ELAIP-Bench上的性能提升。

0 人收藏 0 人点赞

#agent-workflows

@hnshah: https://x.com/hnshah/status/2062647149582750101

X AI KOLs Timeline ↗ · 5天前缓存

本文认为，公司的首个AI策略应该是创建一个'技能库'，以捕捉顶尖员工可复用的工作方法，这样智能体可以学习任务背后的方法，而不仅仅是访问数据。它还推广了一个名为Skills 101的在线研讨会。

0 人收藏 0 人点赞

#agent-workflows

在智能体栈中，你首先会在哪里添加重推理：状态损坏、工具合约不匹配，还是最后的外部动作？

Reddit r/AI_Agents ↗ · 2026-06-01

本文讨论了在智能体工作流中使用 Ring-2.6-1T 添加重推理的位置，以防范状态损坏、工具合约不匹配或最终外部动作等故障点。

0 人收藏 0 人点赞

#agent-workflows

对于AI智能体，较重的推理预算应该优先用在何处：行动之前、状态变化之后，还是最终解释之前？

Reddit r/artificial ↗ · 2026-06-01

关于AI智能体中推理预算分配位置的讨论，引用了拥有高/极高推理努力模式的万亿参数模型Ring-2.6-1T。

0 人收藏 0 人点赞

#agent-workflows

如果你的智能体学到了任何东西，为什么 Run 10 的成本和 Run 1 一样？

Reddit r/ArtificialInteligence ↗ · 2026-06-01

对AI智能体token消耗的批判；提出Token投资回报率（ROTI）作为效率指标，指出大多数智能体不会随着时间减少token使用量。

0 人收藏 0 人点赞

#agent-workflows

在智能体栈中，您会将哪一类失败优先路由到 Ring：工具选择错误、重新规划错误还是最终答案验证？

Reddit r/AI_Agents ↗ · 2026-05-31

关于将失败类别（工具选择错误、重新规划错误、最终答案验证）路由到 Ring-2.6-1T 的讨论，Ring-2.6-1T 是一个用于智能体工作流的万亿参数推理模型，具有高推理努力模式。

0 人收藏 0 人点赞

#agent-workflows

有没有人注意到，构建智能体工作流最困难的部分不再是模型了？

Reddit r/AI_Agents ↗ · 2026-05-30

一位开发者观察到，构建智能体工作流的最大挑战已从模型和提示词转向维护上下文、业务规则和外部数据同步，并向社区询问他们的主要瓶颈。

0 人收藏 0 人点赞

#agent-workflows

@itsclelia: 昨天在@techeurope_的柏林应用人工智能大会上玩得很开心！我做了一个关于构建文档...的演讲

X AI KOLs Following ↗ · 2026-05-29 缓存

参加了在柏林举办的应用人工智能大会，并做了关于构建文档代理的演讲，其中包括使用LlamaIndex构建的文档处理代理LobsterX的详细演示，该代理采用了结构化输出和事件驱动工作流。

0 人收藏 0 人点赞

#agent-workflows

你更愿意调整一个模型的推理深度，还是在两个模型之间切换？

Reddit r/AI_Agents ↗ · 2026-05-24

这是对使用单个可调深度的万亿参数推理模型（如 Ring-2.6-1T）与在多个专用模型之间切换这两种方案的权衡思考，探讨哪种方法对代理工作流更简洁或更具成本效益。

0 人收藏 0 人点赞

#agent-workflows

@nanobot_project: 本地代理、本地模型、本地控制。期待与 @atomic_chat_hq 合作，使本地优先的代理工作流…

X AI KOLs Timeline ↗ · 2026-05-19 缓存

Nanobot 宣布与 Atomic Chat HQ 合作，以简化本地优先的代理工作流程，并更新了文档，使用户能够在自己的机器上使用本地模型运行 nanobot。

0 人收藏 0 人点赞

#agent-workflows

也许下一个模型的胜利在于降低智能体工作流的消耗

Reddit r/AI_Agents ↗ · 2026-05-19

文章讨论了下一个重要的模型进步可能在于降低智能体工作流的成本，重点介绍了蚂蚁集团的 Ling-2.6-1T，这是一个万亿参数模型，旨在以低计算开销实现高效推理和任务执行。

0 人收藏 0 人点赞

#agent-workflows

Ring-2.6-1T 在真实世界智能体任务中达到 SOTA 水平

Reddit r/ArtificialInteligence ↗ · 2026-05-18

蚂蚁集团发布了 Ring-2.6-1T，这是一个拥有 1 万亿参数的推理模型，专为智能体工作流设计，采用 MIT 许可证、扩展上下文，并使用了异步强化学习 (Async RL) 和 IcePop 训练方法，取得了最先进的成果。

0 人收藏 0 人点赞

#agent-workflows

有人在智能体工作流中使用过SLMs吗？

Reddit r/AI_Agents ↗ · 2026-05-16

一位用户向社区询问在智能体工作流中使用小型/本地语言模型执行特定任务（如路由、分类和提取）的情况，并分享了对大型模型是否总是必要的思考。

0 人收藏 0 人点赞

#agent-workflows

AgentKernelArena：兼顾泛化能力的GPU内核优化代理基准测试

Hugging Face Daily Papers ↗ · 2026-05-16 缓存

AgentKernelArena是一个开源基准测试，用于评估AI编码代理在GPU内核优化方面的表现，涵盖完整的代理工作流程以及跨196个任务对未见配置的泛化能力。

0 人收藏 0 人点赞

#agent-workflows

为什么针对智能体工作流的真实数据集仍然难以找到？

Reddit r/AI_Agents ↗ · 2026-05-15

讨论了AI智能体工作流真实数据集的稀缺性，指出现有基准测试未能捕捉到混乱的生产场景，如工具故障、模糊请求和长时间对话漂移，并寻求更好的数据集推荐。

0 人收藏 0 人点赞

#agent-workflows

@dabit3: https://x.com/dabit3/status/2055319214202777894

X AI KOLs Following ↗ · 2026-05-15 缓存

一份技术指南，介绍了 Agent Hooks 这一概念，通过生命周期钩子为智能体工作流添加确定性控制点，使开发者能够在关键时刻强制执行规则并运行验证。

0 人收藏 0 人点赞

#agent-workflows

目前有没有真正优秀的开源替代LangSmith的方案？

Reddit r/AI_Agents ↗ · 2026-05-15

一位开发者寻求推荐用于追踪、评估和调试代理工作流的开源替代LangSmith方案，并指出其付费墙限制。

0 人收藏 0 人点赞

agent-workflows

提交意见反馈