预测Metr的时间跨度数据

Reddit r/singularity 新闻

摘要

本文分析并预测了Metr的时间跨度数据,这些数据可能与AI开发时间线及预测相关。

暂无内容
查看原文

相似文章

著名的METR AI时间跨度图存在大量严重错误[D]

Reddit r/MachineLearning

对著名的METR AI时间跨度图的详细批评揭示了大量严重的方法论错误,包括有偏差的人类基线、未测量的数据以及测试-训练数据污染,削弱了其关于AI能力的结论。

METR评估了Claude Mythos早期版本

Reddit r/singularity

METR于2026年3月使用其时间跨度任务套件对Claude Mythos Preview早期版本进行了评估,估计其50%-时间跨度至少为16小时,表明该模型处于当前基准测试可测量的上限水平,同时也指出在更长的时间范围内存在稳定性问题。

机场航站楼登机口及安检点旅客排队预测

arXiv cs.LG

本文提出了一种基于Transformer的框架,用于预测机场航站楼登机口和安检点的旅客排队长度和等待时间,能够提前两小时进行准确预测,以支持主动式拥堵管理。