policy-compliance

#policy-compliance

基于策略的条件约束解码实现文本到SQL中的列级访问控制

arXiv cs.CL ↗ · 2026-07-15 缓存

本文介绍了PCC-SQL，一种通过约束解码在文本到SQL生成中强制执行列使用策略的方法，实现了违规的确定性消除，泄漏率为0%，并在基准测试中达到了高覆盖率。

0 人收藏 0 人点赞

#policy-compliance

arXiv cs.AI ↗ · 2026-07-09 缓存

本文识别了工具使用型LLM智能体中的一种静默故障模式，其中策略违规发生时既无工具错误，也无智能体自我报告。作者提出并评估了轻量级确定性预执行门控机制，该机制在τ²-bench航空领域显著减少了此类故障。

0 人收藏 0 人点赞

#policy-compliance

arXiv cs.CL ↗ · 2026-05-21 缓存

本文对医疗大语言模型（包括定制MedGPT和开源模型）进行了大规模评估，发现其中25-30%的模型事实准确性较低，33.6-54.3%的模型违反操作阈值，揭示了系统性的安全风险。

0 人收藏 0 人点赞

#policy-compliance

arXiv cs.CL ↗ · 2026-04-20 缓存

PolicyBank提出了一种记忆机制，使LLM智能体能够通过迭代交互和纠正反馈自主改进对组织策略的理解，弥补导致系统性行为偏离真实需求的规范差距。该工作引入了一个系统化测试平台，并展示PolicyBank能够解决高达82%的策略差距对齐失败，显著超越现有记忆机制。

0 人收藏 0 人点赞