@yoheinakajima:我展示了一种新颖的“regime-to-seam”方法,用于受控的自我改进,其中失败被分类并允许……
摘要
作者展示了一种受控的自我改进方法,适用于AI智能体,使用一种称为“regime-to-seam”的方法,将失败分类以修复目标区域,该方法基于activegraph构建。
我展示了一种新颖的“regime-to-seam”方法,用于受控的自我改进,其中失败被分类并允许修复智能体的目标区域。
虽然有趣,但更重要的是展示这种使用activegraph即可轻松设置的自我修改类型。https://t.co/4S4fmmNfxQ
查看缓存全文
缓存时间: 2026/06/11 17:39
我展示了一种“受控”的自我改进,采用一种新颖的“从规则到接口”方法:失败被分类,并允许修复智能体的目标区域。
虽然有趣,但这更多是为了展示一种通过ActiveGraph就能轻松搭建的自我修改类型。https://t.co/4S4fmmNfxQ
相似文章
@yoheinakajima: 在 arxiv 论文 #2 中,我处理了论文 #1 中的最后一个主题:@activegraphai 作为自我改进代理的架构可供性 self-improv…
本文介绍了Regimes,一种基于ActiveGraph运行时的可审计、保留门控改进循环,用于自我改进代理。它通过在LongMemEval数据集上自主发现通过静态检查、沙盒执行和保留验证的提示修复,展示了适度的改进。
@yoheinakajima: 不太新颖,但仍非常有趣的一个关键点是采用门控方法进行自我修改:智能体基本上会fork自身……
讨论了一种针对AI智能体自我修改的门控方法,智能体通过fork自身、提出补丁、并运行多项测试(静态/沙箱/diff)后,修改才会生效。
Regimes:一种可审计、保留样本门控的改进循环——在ActiveGraph上对LongMemEval的演示
Regimes是一个建立在ActiveGraph事件溯源运行时上的可审计、保留样本门控的改进循环。它诊断AI智能体中的失败,提出修复方案,并仅在通过多重门控后才予以提升,将LongMemEval上的准确率最多提高了+0.10。
@rohanpaul_ai: 这篇论文展示了一种人工智能通过重写其设置并更新其模型来更好地自我改进。问题是,大部分…
本文介绍了SIA,一种自我改进的AI循环,它结合了脚手架重写和权重更新(通过LoRA)以提升任务性能。在三个不同的任务上测试,它优于仅使用脚手架改进的设置。
@omarsar0:关于自我改进智能体的优秀论文。为什么?我们需要更深入地思考 AI 智能体系统设计。该协议规范……
一篇论文提出了一种自我改进 AI 智能体的协议框架,支持可审计的改进提案、评估与回滚。