@su_kidd:今日人物卡:Percy Liang。不仅在造模型——更在定义如何评估它们。斯坦福教授、CRFM主任、HELM 之父。
摘要
斯坦福教授兼 CRFM 主任 Percy Liang,凭借 HELM 在 AI 模型评估领域的开创性工作备受瞩目。
今日人物卡:Percy Liang。不仅在造模型——更在定义如何评估它们。斯坦福教授、CRFM 主任、HELM 之父。这是领域级影响力 → 90/100。他正在定义 AI“进步”本身的含义。#AIScout
查看缓存全文
缓存时间: 2026/04/21 10:18
今日人物:Percy Liang。他不只是做模型——更在塑造我们如何评估模型。斯坦福教授、CRFM 主任、HELM 创建者。这种影响力属于“定义赛道”级别 → 90/100。他正在定义“AI 进步”本身意味着什么。#AIScout
相似文章
关于算法、生活与学习
麻省理工学院教授 Dimitris Bertsimas 荣获第54届 James R. Killian 教职成就奖,并发表演讲,介绍其运筹学与 AI 研究如何切实推动物流、医疗、教育和农业等领域的现实改进。他提出的鲁棒优化方法已带来诸多实际应用价值,例如提升医院患者周转效率以及优化巴拿马运河的船舶调度安排。
@pauliusztin_:每天都有100+人问我“怎么学AI评估?”我每次都把11个链接直接粘贴:1. AI评估与可观测(系列)
一份每日被反复转发的11个精选链接,帮你掌握AI评估技术,涵盖评估方法、可观测性、LLM-as-judge与智能体评估。
@jiqizhixin:太棒了!关于推理型LLM的强化学习现状 https://aweers.de/blog/2026/rl-for-llms/…
一篇全面回顾推理型LLM强化学习现状的博文,涵盖从REINFORCE、PPO到GRPO乃至更多方法,并与InstructGPT、DeepSeek-R1等关键模型相联系。
@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...
Yann LeCun的团队发布了LeWorldModel,一个仅有1500万参数的物理模型,在单张GPU上训练数小时,在规划速度和物理合理性上超越了价值数十亿美元的基础模型,挑战了主流的规模扩展范式。
世界模型或将改变一切(20分钟阅读)
文章探讨了世界模型对AI可能产生的范式变革性影响,重点介绍了Yann LeCun和Fei-Fei Li等人在该技术领域的投入,认为其有望成为当前LLM范式的继任者。