标签
马克斯·普朗克研究所的研究人员推出了FutureSim,这是一个通过回放历史网络数据让AI代理预测真实世界未来事件的环境。在Codex上运行的GPT 5.5在部分Polymarket市场(如超级碗LX)上取得了近乎完美的Brier技能分数,超越了人类聚合市场,但在英国大选和格莱美奖等其他市场上表现不佳。
文章声称我们即将实现完全沉浸式的虚拟现实环境,类似于《星际迷航》中的全息甲板。
Anthropic 的 Angela Jiang 预测,随着 AI 智能体自主调用(Harness)并执行任务,手动编写 Prompting 将在一年内变得过时。