标签
CP-Agent 提出了一种借助大型语言模型的校准风险控制方法,用于反馈驱动型竞赛编程,无需参数更新即可在基准测试上取得显著改进。
GrandCode是一个多智能体强化学习系统,在竞技编程中达到了特级大师水平,通过新颖的Agentic GRPO方法,在实时Codeforces竞赛中持续击败所有人类参赛者。
Solvita是一个智能体进化框架,通过强化学习更新图结构知识网络,实现代码生成中的持续学习,在竞赛编程基准测试中达到了最先进的性能。
本档专访采访了 Cognition AI 联合创始人 Scott Wu,深入探讨了他作为竞技编程神童的背景,以及他的 AI 编码代理 Devin 迅速取得的商业成功。Devin 目前的年化营收预期已达 4.45 亿美元,估值高达 250 亿美元。