标签
PolyGnosis 是一个基于 Hermes 技能构建的对抗式多模型共识系统。它并行运行三个具有不同专家角色的 AI 模型,然后进入对抗性批评阶段,通过 RRF 和 Borda Count 进行评分,最后通过合成门——所有这些都使用 DeepSeek V4-Pro 以智能体方式构建。
一种在单个消费级GPU上自主训练Transformer语言模型的方法,分为六个阶段,设有验证门和AGENTS.md规范,适用于OpenClaw等编排框架。
作者反思了将AI智能体从原型推向生产环境的挑战,得出结论:可靠的编排和安全保护机制比模型的渐进改进更为关键。
Claude Code 引入了一种动态工作流功能,Claude 可以编写编排脚本、生成子代理集群并验证结果,可通过 /model opus 4.8 和 /effort ultracode 访问。
Claude Code推出动态工作流功能,可实时生成编排脚本并并行运行大量子agent处理复杂任务,支持Max、Team、Enterprise及API端,但token消耗显著高于普通会话。
Claude Code 推出了动态工作流功能,允许用户通过设置参数和提示词来启动子Agent并进行结果验证与汇报。
Anthropic的Opus 4.8在Terminal-Bench 2.1上比GPT 5.5低3.6%,但擅长UI任务;Orca的编排功能让Codex能将UI任务委托给Claude Code。
Claude Code 引入了动态工作流,允许 Claude 编写编排脚本并生成协调的子代理,以执行复杂任务。
Claude Code 的研究预览现在包含动态工作流,允许 Claude 编写编排脚本并为复杂任务启动协调的子代理。
文章认为,当前像 LangChain 和 CrewAI 这样的智能体编排框架将独立关注点捆绑成一个整体模块,导致缺乏灵活性。文章介绍了 iii 引擎,其中每个职责都是一个独立的、可替换的工作单元,通过共享总线和单一触发原语连接,使开发者能够通过替换工作单元而非分叉框架来组合自己的编排方案。
讨论了大型科技公司正在将高性能模型与Google Drive、Slack等标准连接器结合,并添加横向agent编排层,例如Cowork和Codex的做法。
本文探讨了当像Claude这样的AI能够控制浏览器并编排其他AI系统时所面临的安全风险,强调无论多少红队测试都无法完全抵御语义攻击和供应链操纵。
本文认为,智能体AI的下一个瓶颈是系统规模扩展(围绕基础模型设计“框架”),而不仅仅是模型规模扩展,并介绍了CheetahClaws(一个Python原生参考框架),以及对三个核心瓶颈的分析:上下文治理、可信内存和动态技能路由。
Cloudflare构建了一个CI原生的AI代码审查编排系统,使用多达七个由协调器管理的专业代理,在数千个合并请求中提供结构化、准确的审查。
Hermes Agent 现在支持通过一项新的可选技能来协调 OpenHands 代理,加入已有的内置技能(Claude Code、Codex、OpenCode 和 Hermes 本身)。
一篇评论,指出扩展AI代理时面临的运营挑战——如编排、重试、权限、速率限制和可审计性——与2017年SaaS计费系统遇到的挑战十分相似。
Axel 是一款 macOS 应用,配有 Rust CLI,可在隔离的 git worktrees 和 tmux panes 中编排 AI 代理,为多代理工作流提供任务管理界面。
关于使用 Claude Managed Agents 构建多智能体团队的全面指南,涵盖角色设计、模型混合和并行执行,以将团队从1个扩展到20个智能体。
Emperor Claw OS 是一个基于 Web 的任务控制层,用于协调本地 OpenClaw 代理团队,提供共享内存、知识库、任务管理和操作工作流。
Mission Control 是一个用于 AI 智能体编排的开源仪表盘,自托管且零外部依赖,支持实时监控、多网关和基于角色的访问。