auditing

标签

Cards List
#auditing

TSFMAudit: 时间序列基础模型预测中的数据污染审计

arXiv cs.LG · 2026-05-27 缓存

本文介绍了TSFMAudit,这是首个用于审计时间序列基础模型预训练数据污染的方法,通过探针适应动态来检测异常高效的微调,从而指示先前的数据暴露。

0 人收藏 0 人点赞
#auditing

形式化方法遇上大语言模型:面向先进AI系统合规性的审计、监控与干预

arXiv cs.AI · 2026-05-18

本文提出了一种将形式化方法(线性时序逻辑)与大语言模型相结合的技术,用于审计、监控和干预AI系统以确保其符合行为约束。研究表明,即便是小模型标注器在检测违规行为方面也能媲美前沿大语言模型裁判。

0 人收藏 0 人点赞
#auditing

运行时治理:2026年AI代理缺失的一环

Reddit r/AI_Agents · 2026-05-14

文章讨论了AI代理运行时治理的必要性,以平衡自主性与合规性,并介绍了SAFi——一个开源框架,可实时执行策略并审计操作。

0 人收藏 0 人点赞
#auditing

我询问了20位Agentic AI创始人如何处理智能体访问权限。17位表示依靠临时权宜之计。

Reddit r/AI_Agents · 2026-05-10

作者调查了20位Agentic AI创始人,发现由于缺乏可验证的授权层,其中17位依靠临时权宜之计来处理智能体访问控制。这突显了处理敏感数据的AI智能体在安全性和审计方面存在显著差距。

0 人收藏 0 人点赞
← Previous
← 返回首页

提交意见反馈