METR评估了Claude Mythos早期版本

Reddit r/singularity 新闻

摘要

METR于2026年3月使用其时间跨度任务套件对Claude Mythos Preview早期版本进行了评估,估计其50%-时间跨度至少为16小时,表明该模型处于当前基准测试可测量的上限水平,同时也指出在更长的时间范围内存在稳定性问题。

[https://metr.org/time-horizons/](https://metr.org/time-horizons/) "我们在2026年3月的有限窗口期内对Claude Mythos Preview早期版本进行了风险评估。我们在其任务套件上估计其50%-时间跨度至少为16小时(95%置信区间为8.5小时至55小时),处于我们可以在不添加新任务的情况下测量的上限。[](https://x.com/METR_Evals/status/2052896621760004602/photo/1) 在我们套件的228个任务中,只有5个估计耗时16小时以上,使得这一范围的测量不如任务覆盖更好的范围稳定。因此,我们不会对使用当前套件测量超过16小时的模型强调精确估计。[](https://x.com/METR_Evals/status/2052896623852929510/photo/1) 我们相信这个任务套件仍然可以区分出比当前已公开的最先进模型能力更强的模型。但我们认为这一范围的测量不够稳健,无法进行精确的定量比较或推论。原则上,时间跨度方法允许我们通过添加更长的任务来测量更高能力的模型,我们正在开发更新的方法。但这些方法仍在开发中;目前,我们建议对近期的时间跨度数据谨慎解读。"
查看原文

相似文章

2026年4月30日 社会影响人们如何向Claude寻求个人指导

Anthropic Research

Anthropic发布了关于用户如何向Claude寻求个人指导的研究,重点介绍了不同领域中美言奉承率(sycophancy rates)的研究发现。该研究为Claude Opus 4.7和Mythos Preview的训练提供了参考,以更好地保护用户福祉。

利用 Claude Mythos Preview 加固 Firefox

Hacker News Top

Mozilla 详细介绍了他们如何利用 Claude Mythos Preview 及其他 AI 模型识别并修复了 Firefox 中的大量潜在安全漏洞,展示了 AI 在代码加固方面效能的提升。

幕后:使用 Claude Mythos 预览版强化 Firefox

Simon Willison's Blog

Mozilla 借助 Claude Mythos 预览版系统性地发现并修复了 Firefox 中数百个安全漏洞,使其漏洞修复率从每月约 20-30 个大幅提升至 2026 年 4 月的 423 个。