预测Metr的时间跨度数据

Reddit r/singularity 2026/06/18 22:23 新闻

ai-timelines forecasting metr time-horizons ai-progress data-analysis

摘要

本文分析并预测了Metr的时间跨度数据，这些数据可能与AI开发时间线及预测相关。

暂无内容

查看原文

相似文章

Reddit r/MachineLearning

对著名的METR AI时间跨度图的详细批评揭示了大量严重的方法论错误，包括有偏差的人类基线、未测量的数据以及测试-训练数据污染，削弱了其关于AI能力的结论。

Reddit r/singularity

METR于2026年3月使用其时间跨度任务套件对Claude Mythos Preview早期版本进行了评估，估计其50%-时间跨度至少为16小时，表明该模型处于当前基准测试可测量的上限水平，同时也指出在更长的时间范围内存在稳定性问题。

arXiv cs.LG

本文提出了一种基于Transformer的框架，用于预测机场航站楼登机口和安检点的旅客排队长度和等待时间，能够提前两小时进行准确预测，以支持主动式拥堵管理。

arXiv cs.AI

本文通过在30,000个问题上测量前沿AI模型在没有显式思维链的情况下的推理能力，发现无CoT的任务完成时间视野每年翻一番，到2028年可能超过7分钟，这引发了对安全监管的担忧。

arXiv cs.LG

本文介绍了一种多时间尺度时间序列预测框架，使用DLinear和NLinear模型预测急诊科滞留时间，并开发了一个MLOps网页应用原型，以支持主动运营决策。