symbolic-guardrails

标签

Cards List
#symbolic-guardrails

面向特定领域智能体的符号护栏:不牺牲实用性的更强安全与保障

Hugging Face Daily Papers · 2026-04-16 缓存

本文提出符号护栏,通过具体策略为特定领域AI智能体提供可证明的安全与保障,同时不降低实用性;实验显示74%的指定策略可通过简单机制强制执行。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈