计算机科学会议应要求不可否认的实验结果
摘要
本文主张计算机科学会议应要求不可否认的实验结果,以防止篡改和否认,并介绍了 K-Veritas,一种无需访问训练数据即可生成签名报告的参考实现。
查看缓存全文
缓存时间: 2026/05/20 22:40
论文页面 - 计算机科学会议应要求不可否认的实验结果
来源:https://huggingface.co/papers/2605.08586 发布于5月9日
·
提交者https://huggingface.co/Mamadou2727
MKLD (https://huggingface.co/Mamadou2727) 于5月20日
摘要
这篇立场论文主张,计算机科学会议应要求对实验结果提供防篡改、不可否认的证明。我们将底层问题命名为实验不可否认性:一个合规协议必须将论文中的数字与实际执行的运算绑定,使得作者事后无法修改或否认。当前系统依赖于自行报告的清单、可选的代码共享以及作者控制的日志。这些机制均无法回答审稿人无法检查的问题:论文所描述的代码是否真的产生了论文所报告的数字?我们形式化地定义了该问题,阐述了任何合规协议必须满足的安全属性,并描述了一个包含当前方法无法防范的攻击的威胁模型。为了证明该问题可解,我们构建了 K-Veritas,一个用 Go 编写的参考实现,能在不访问训练数据的情况下生成签名报告。K-Veritas 是一个测试平台,而非最终答案。我们呼吁会议和社区将不可否认性视为一项首要需求,并共同为其建立一个开放、独立的标准。
查看 arXiv 页面 (https://arxiv.org/abs/2605.08586) 查看 PDF (https://arxiv.org/pdf/2605.08586) 项目页面 (https://kveritas.org/) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.08586)
在您的代理中获取此论文:
hf papers read 2605\.08586
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有模型链接此论文
在模型的 README.md 中引用 arxiv.org/abs/2605.08586 以从此页面链接。
引用此论文的数据集0
没有数据集链接此论文
在数据集的 README.md 中引用 arxiv.org/abs/2605.08586 以从此页面链接。
引用此论文的 Spaces0
没有 Space 链接此论文
在 Space 的 README.md 中引用 arxiv.org/abs/2605.08586 以从此页面链接。
包含此论文的收藏集0
没有收藏集包含此论文
将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。
相似文章
OpenComputer:面向计算机使用智能体的可验证软件世界
OpenComputer 提出了一种框架,用于为计算机使用智能体创建可验证的软件环境,集成了状态验证器、自改进验证层、任务合成以及评估系统,覆盖33个桌面应用程序。实验表明,其验证器与人类判断的一致性优于LLM作为判断者,且前沿智能体在端到端完成方面仍面临困难。
软件在没有形式化证明的情况下如何变得如此可靠?(1996年)
这篇1996年的论文探讨了尽管缺乏形式化证明,软件可靠性却日益提高的原因,讨论了非正式方法和工程实践。
Kettle:用于可验证软件溯源的经认证构建
本文介绍了 Kettle,一种经认证的构建系统,利用可信执行环境(TEE)生成加密可验证的软件溯源信息。它旨在通过将溯源文档直接与硬件签名的认证报告绑定,消除构建基础设施和操作人员对信任模型的影响。
ScientistOne:通过 Chain-of-Evidence 实现人类级自主研究
ScientistOne 引入了 Chain-of-Evidence,这是一个面向自主研究代理的可验证性框架,确保每个声明都可追溯到证据来源。该框架实现了零幻觉引用、完美的分数验证,并在 75 篇论文中达到了最高的方法-代码对齐度,同时在五个前沿研究任务上达到或超过了人类专家水平。
AI科学家何时应停止?面向自主发现的可验证实验引导与拒绝机制
本文介绍了Cartograph,一种为AI科学家设计的验证层,它结合了子空间实验引导、模糊性解析和库不充分检测。该框架在自主发现测试平台上优于基线,并回顾性地标记了A-Lab材料系统中不明确的声明。