stateful-workspaces

标签

Cards List
#stateful-workspaces

SABER:在具有状态的项目工作空间中评估LLM编码代理的操作安全性基准

Hugging Face Daily Papers · 2026-05-31 缓存

SABER引入了一个基准,用于评估LLM编码代理在真实具有状态的项目工作空间中的操作安全性,显示即使是最佳模型也有超过54%的有害安全违规率,表明在真实世界环境中的对齐不足。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈