标签
字节跳动 Seed 发布了 EdgeBench,这是一个基准测试,用于测试AI代理能否通过执行超过12小时的现实世界任务来从经验中提升,将评估从静态知识转向动态学习。
EdgeBench揭示了一条新缩放定律,表明即时AI学习速度每三个月翻一番。