标签
OpenAI 的复古竞赛圆满落幕,923 个团队参赛,利用 Sonic 基准开发可泛化的算法。排名靠前的团队主要使用了经过调优的现有算法,如 PPO 和 Rainbow DQN,其中 Dharmaraja 以 4,692 分(理论最高分为 10,000 分)赢得第一名。