risk-control

标签

Cards List
#risk-control

CP-Agent:一种用于反馈驱动型竞赛编程的校准风险控制代理

arXiv cs.CL · 2026-05-26 缓存

CP-Agent 提出了一种借助大型语言模型的校准风险控制方法,用于反馈驱动型竞赛编程,无需参数更新即可在基准测试上取得显著改进。

0 人收藏 0 人点赞
#risk-control

Conformal Selective Acting: 为RLVR训练的LLM提供任意时刻有效的风险控制

arXiv cs.LG · 2026-05-21 缓存

介绍了Conformal Selective Acting (CSA),一种用于RLVR训练的LLM的部署时包装器,它提供了对单个流的任意时刻有效的选择性风险控制,从而在不进行池化或长期平均的情况下,能够在受监管环境中安全部署。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈