policy-induction

标签

Cards List
#policy-induction

LiSA:通过保守策略归纳实现终身安全适应

Hugging Face Daily Papers · 2026-05-14 缓存

LiSA(终身安全适应)是一个框架,通过将偶尔的失败转化为可重用的策略抽象,并利用基于证据的置信门控在稀疏和噪声反馈下保持良好性能,从而增强AI代理的安全护栏,解决实际部署中对自适应安全的关键需求。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈