标签
Regimes是一个建立在ActiveGraph事件溯源运行时上的可审计、保留样本门控的改进循环。它诊断AI智能体中的失败,提出修复方案,并仅在通过多重门控后才予以提升,将LongMemEval上的准确率最多提高了+0.10。