计算机科学会议应要求不可否认的实验结果

Hugging Face Daily Papers 论文

摘要

本文主张计算机科学会议应要求不可否认的实验结果,以防止篡改和否认,并介绍了 K-Veritas,一种无需访问训练数据即可生成签名报告的参考实现。

这篇立场论文认为,计算机科学会议应要求实验结果的防篡改、不可否认证明。我们将底层问题命名为实验不可否认性:一个合规的协议必须将论文中的数值绑定到实际执行的计算上,使得作者之后无法更改或否认。当前系统依赖于自我报告清单、可选的代码共享和作者控制的日志。这些机制都无法回答审稿人无法检查的问题:论文描述的代码是否产生了论文报告的数字?我们正式定义了该问题,说明了任何合规协议必须满足的安全属性,并描述了当前方法未能防止的攻击的威胁模型。为了证明该问题是可解的,我们构建了 K-Veritas,一个用 Go 编写的参考实现,可在不访问训练数据的情况下生成签名报告。K-Veritas 是一个测试平台,并非最终答案。我们呼吁会议和社区将不可否认性视为一项首要要求,并帮助建立其开放、独立的标准。
查看原文
查看缓存全文

缓存时间: 2026/05/20 22:40

论文页面 - 计算机科学会议应要求不可否认的实验结果

来源:https://huggingface.co/papers/2605.08586 发布于5月9日

·

提交者https://huggingface.co/Mamadou2727

MKLD (https://huggingface.co/Mamadou2727) 于5月20日

摘要

这篇立场论文主张,计算机科学会议应要求对实验结果提供防篡改、不可否认的证明。我们将底层问题命名为实验不可否认性:一个合规协议必须将论文中的数字与实际执行的运算绑定,使得作者事后无法修改或否认。当前系统依赖于自行报告的清单、可选的代码共享以及作者控制的日志。这些机制均无法回答审稿人无法检查的问题:论文所描述的代码是否真的产生了论文所报告的数字?我们形式化地定义了该问题,阐述了任何合规协议必须满足的安全属性,并描述了一个包含当前方法无法防范的攻击的威胁模型。为了证明该问题可解,我们构建了 K-Veritas,一个用 Go 编写的参考实现,能在不访问训练数据的情况下生成签名报告。K-Veritas 是一个测试平台,而非最终答案。我们呼吁会议和社区将不可否认性视为一项首要需求,并共同为其建立一个开放、独立的标准。

查看 arXiv 页面 (https://arxiv.org/abs/2605.08586) 查看 PDF (https://arxiv.org/pdf/2605.08586) 项目页面 (https://kveritas.org/) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.08586)

在您的代理中获取此论文:

hf papers read 2605\.08586

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型链接此论文

在模型的 README.md 中引用 arxiv.org/abs/2605.08586 以从此页面链接。

引用此论文的数据集0

没有数据集链接此论文

在数据集的 README.md 中引用 arxiv.org/abs/2605.08586 以从此页面链接。

引用此论文的 Spaces0

没有 Space 链接此论文

在 Space 的 README.md 中引用 arxiv.org/abs/2605.08586 以从此页面链接。

包含此论文的收藏集0

没有收藏集包含此论文

将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。

相似文章

OpenComputer:面向计算机使用智能体的可验证软件世界

Hugging Face Daily Papers

OpenComputer 提出了一种框架,用于为计算机使用智能体创建可验证的软件环境,集成了状态验证器、自改进验证层、任务合成以及评估系统,覆盖33个桌面应用程序。实验表明,其验证器与人类判断的一致性优于LLM作为判断者,且前沿智能体在端到端完成方面仍面临困难。

Kettle:用于可验证软件溯源的经认证构建

Lobsters Hottest

本文介绍了 Kettle,一种经认证的构建系统,利用可信执行环境(TEE)生成加密可验证的软件溯源信息。它旨在通过将溯源文档直接与硬件签名的认证报告绑定,消除构建基础设施和操作人员对信任模型的影响。

ScientistOne:通过 Chain-of-Evidence 实现人类级自主研究

arXiv cs.AI

ScientistOne 引入了 Chain-of-Evidence,这是一个面向自主研究代理的可验证性框架,确保每个声明都可追溯到证据来源。该框架实现了零幻觉引用、完美的分数验证,并在 75 篇论文中达到了最高的方法-代码对齐度,同时在五个前沿研究任务上达到或超过了人类专家水平。