cmu

标签

Cards List
#cmu

@rohanpaul_ai: 精彩新论文来自Meta、CMU及其他实验室。表明编码代理通过制造自己的...来更快地提升。

X AI KOLs Following · 2026-05-26 缓存

来自Meta、CMU及其他实验室的一篇新论文提出了Self-play SWE-RL,这是一种方法,编码代理通过在实际代码库中制造和修复错误来训练自己,在SWE-bench基准测试上取得了显著提升,且不依赖人类编写的任务。

0 人收藏 0 人点赞
#cmu

@Phoenixyin13: 很敬佩的一位Thinker @TairanHe99 何泰然同学加入了OpenAI! WhyNot Channel我很喜欢,从2025年就开始看,虽然很长,但我每次都会看完。 Tairan是CMU PhD,他研究的内容应该是和机器人学有关。…

X AI KOLs Timeline · 2026-05-13

何泰然(Tairan He)从CMU博士毕业后加入OpenAI,其研究背景主要涉及机器人学。

0 人收藏 0 人点赞
#cmu

@ickma2311:CMU 高级 NLP:强化学习 我一直好奇 RL 如何作用于大模型,而这门 CMU 课程让我豁然开朗……

X AI KOLs Timeline · 2026-04-21 缓存

CMU 高级 NLP 课程讲清了强化学习如何优化整个输出的奖励(正确性、有用性、安全性),而非预训练/微调阶段的下一个 token 预测。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈