verification

标签

Cards List
#verification

Linux Foundation 希望使用 DNS 作为 AI 代理的身份层

Reddit r/artificial · 4小时前

Linux Foundation 宣布推出 Agent Name Service(ANS),这是一项利用 DNS 为 AI 代理提供可验证身份、实现信任与互操作性的开放标准。

0 人收藏 0 人点赞
#verification

基于方向锐度的机器学习模型认证

arXiv cs.LG · 16小时前 缓存

本文提出方向锐度这一新指标,用于认证机器学习模型的泛化性能。该指标计算高效,且比测试准确率或传统锐度等现有近似指标更可靠,即便训练过程偏离预定程序也是如此。

0 人收藏 0 人点赞
#verification

@0xRicker: Anthropic Agents 团队刚刚发布了一份11页的论文《Loop Design: The Anthropic Playbook for Agentic Systems》。每个人…

X AI KOLs Timeline · 昨天 缓存

Anthropic 发布了一份11页的论文,题为《Loop Design: The Anthropic Playbook for Agentic Systems》,指出在智能体设计中,独立验证者比提示词更为关键。

0 人收藏 0 人点赞
#verification

上下文至关重要,但上下文腐烂才是AI智能体的真正上限,更大的上下文窗口只会让情况更糟而非更好

Reddit r/singularity · 昨天

文章认为,上下文腐烂(即随着上下文填充导致推理质量下降)是AI智能体的真正上限,而非上下文窗口大小。它提倡采用架构方法分解任务并使用独立验证来超越限制。

0 人收藏 0 人点赞
#verification

两名律师因提交AI编造的案例被联邦上诉法院制裁

Reddit r/artificial · 昨天

美国一联邦上诉法院制裁了两名律师,因其提交了AI编造案例的诉状,这凸显了法律实践中AI幻觉的持续问题以及独立核实引文的必要性。

0 人收藏 0 人点赞
#verification

VeryTrace:通过可编译形式化与结构化验证来验证推理轨迹

arXiv cs.AI · 昨天 缓存

VeryTrace 是一种零样本验证与修复框架,它将大语言模型的推理轨迹通过领域特定语言形式化为可编译表示,从而通过确定性检查与大语言模型审计的混合方式实现步骤级错误定位。该框架在数学、机器人学和关系推理等多个领域提升了准确性,且无需领域特定训练。

0 人收藏 0 人点赞
#verification

@dunik_7: https://x.com/dunik_7/status/2069079047510864322

X AI KOLs Timeline · 3天前 缓存

LangChain的循环工程手册通过四个嵌套循环(代理循环、验证循环、事件驱动循环和爬山循环)替代了提示工程,使AI代理能够随着时间的推移自动自我改进。该文章认为,构建自我优化循环如今已成为关键的竞争优势,而非使用更先进的模型。

0 人收藏 0 人点赞
#verification

@sunaiuse: https://x.com/sunaiuse/status/2069077492267098483

X AI KOLs Timeline · 3天前 缓存

这篇帖子解释了为什么AI开发者应该使用循环而非单一提示,并强调了合适的触发条件、验证机制和停止条件,以构建可靠且成本效益高的AI系统。

0 人收藏 0 人点赞
#verification

AI逻辑的蛮力方法确实遇到了瓶颈

Reddit r/ArtificialInteligence · 3天前

文章认为自回归语言模型无法真正理解形式数学,需要验证方法,并引用了诸如Aleph等依赖严格数学证明的系统。

0 人收藏 0 人点赞
#verification

@Phoenixyin13: 一个好的Loop到底需要什么? 这篇文章终于聊了最有价值的部分, 排名第一重要的,验证机制, AI不能自己给自己打分。它会给自己满分。必须有客观的检查方式,比如代码跑测试通过、文章符合字数+结构要求、数字对得上等,没有这个,循环就是在浪费…

X AI KOLs Timeline · 3天前 缓存

文章讨论了AI循环中最重要的三个要素:验证机制、记忆和停止条件,并指出当前全自动循环的成本效益问题。

0 人收藏 0 人点赞
#verification

可验证的搜索不是可学习的思维链

Hugging Face Daily Papers · 5天前 缓存

本文表明,在需要回溯搜索的任务上,使用思维链演示训练模型会失败,说明搜索过程无法被忠实模仿。作者发现,即使模型在子组件上表现良好,它们也无法在密码算术任务中推进从左到右的推导。

0 人收藏 0 人点赞
#verification

真实性问题

Reddit r/artificial · 5天前

文章表达了对AI生成内容污染互联网的长期影响的担忧,这使得验证真实性和与现实依据变得困难,并对未来AI治理的系统造成严重后果。

0 人收藏 0 人点赞
#verification

我们一直在分析人们如何在法律与合规任务中使用LLM(GDPR、AI法案等)。

Reddit r/ArtificialInteligence · 6天前

对LLM在法律与合规任务中使用的分析显示,模型常常生成自信但无法验证的引用,引发了对AI输出可靠法律依据的质疑。

0 人收藏 0 人点赞
#verification

@sheriyuo: Best-of-N、拒绝采样和基于评分标准的排序都假设你已经有一种可靠的方法来评估候选答案…

X AI KOLs Timeline · 2026-06-18 缓存

Apodex 发布了 Apodex-1.0,一个深度研究模型,它使用一个带有全局验证的重型代理团队,在包括 BrowseComp、DeepSearchQA 和 HLE 在内的多个基准测试中取得了最先进的结果。

0 人收藏 0 人点赞
#verification

重新思考还是思考更久?面向预算感知推理的选择性验证

Hugging Face Daily Papers · 2026-06-18 缓存

介绍了SEVRA,一种用于预算感知推理的选择性验证控制器,它决定何时接受模型的初始答案,何时在验证上花费额外计算资源,在MATH500和GSM8K等基准上提高了准确率并减少了不必要的token。

0 人收藏 0 人点赞
#verification

@Vtrivedy10: 来自悉尼的又一精彩之作!我认为整个循环层次结构还非常早期,但一些我们知道有效的原语…

X AI KOLs Following · 2026-06-16 缓存

这条推文讨论了AI代理中循环层次结构的早期阶段,强调验证是可靠半长周期工作的关键原语。

0 人收藏 0 人点赞
#verification

大多数对 Fable 5 进行逆向工程的尝试都抓错了重点

Reddit r/artificial · 2026-06-16

本文批评了通过复制表面行为来逆向工程 Fable 5 的尝试,转而介绍了 Hephaestus Stormbreaker——一个针对编码智能体的鲁棒性控制层,它强制进行范围锁定、证据循环、回归测试和关卡检查,以防止智能体漂移和过早退出。

0 人收藏 0 人点赞
#verification

AI智能体之间的信任:测量形成、破裂与恢复,及其对多智能体系统治理的启示

arXiv cs.AI · 2026-06-16 缓存

本文基于合作生存游戏中的成本验证,提出了一种衡量AI智能体之间信任的行为测量方法,研究了六个前沿模型快照中信任的形成、破裂与恢复。研究发现不同模型在信任校准上存在差异,且持续过度验证与犹豫不决而非安全性相关。

0 人收藏 0 人点赞
#verification

@vintcessun: 学术Agent最头疼的问题不是写不出,而是写出来没法保证可信。这个项目直接给Claude Code加了一套可审计的学术管道:从研究到写作到审稿回复,每一阶段都有硬性检查点——比如用四库引用验证查真假,用实验声明对齐防止夸大,用审稿回复审计…

X AI KOLs Timeline · 2026-06-16 缓存

该项目为Claude Code添加了一套可审计的学术研究流程,包括引用验证、实验声明对齐等检查点,确保研究成果的可信度。

0 人收藏 0 人点赞
#verification

我停止信任我的编程代理的通过测试。构建了一个控制循环来让它证明自己的工作。

Reddit r/AI_Agents · 2026-06-16

作者介绍了一种验证驱动的控制循环,用于编程代理,受核工业安全实践启发,确保代理在变更被接受之前证明其工作。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈