@dunik_7:那场价值9万美元的斯坦福讲座,解释了为什么AI能通过所有基准测试,却在你的代码库上崩溃,刚刚发布……
摘要
一场由Percy Liang主讲的免费斯坦福讲座,关于AI泛化,解释了为什么模型在基准测试中表现出色,但在实际代码库中却失败,内容涵盖基准记忆、偏差-方差权衡和幻觉。
查看缓存全文
缓存时间: 2026/05/22 13:52
价值9万美元的斯坦福讲座刚刚在YouTube上免费发布,它解释了为何AI能通过所有基准测试,却仍然会在你的代码库上出问题。
核心就一个词:泛化。
这正是AI能解决从未接受过训练的问题的原因,也是它会在看似简单的任务上自信犯错的原因。
Percy Liang的80分钟讲座。看完之后,你会对以下三点茅塞顿开:
/ 为什么基准测试分数会撒谎(模型可以记住测试题却什么都不理解)
/ 为什么“更聪明”的模型有时反而在简单问题上表现更差(偏差-方差权衡,不是bug)
/ 为什么Claude能回答从未出现在训练数据中的问题,却紧接着胡编乱造下一个 这是约20讲系列中的第4讲。免费。
此后,“AI只是产生了幻觉”就不再是借口了。你能在它出问题之前就看出哪里会崩。
dunik (@dunik_7): Anthropic支付其机器学习工程师年薪超过50万美元部署的成果,正是Percy Liang在CS221第3讲中免费教授的内容。
80分钟。一块白板。涵盖从“一个神经元”到此刻在你IDE中运行的模型之间的一切。
看完之后,你会对以下三点茅塞顿开:
/ 为什么两个Claude提示词
相似文章
@polydao: 这堂关于AI推理的斯坦福课程比大多数ML课程更能让你了解LLM在生产环境中的运作方式 > Clau…
一场关于AI推理的斯坦福讲座强调了KV-cache等实际瓶颈以及推测性解码和连续批处理等技术,比典型ML课程提供更多现实世界的洞察。
@codewithimanshu:斯坦福教授刚刚免费公开了AI智能体与自动化的全部底层逻辑,1小时讲座。T…
斯坦福教授发布免费1小时讲座,系统讲解AI智能体、工具调用、多步工作流、规划与反思的核心原理。
@dunik_7: Percy Liang 教授斯坦福学生 AI 的真实思考方式,现在我们也能够学习。同样的斯坦福本科课程…
Percy Liang公开了他在斯坦福大学授课的AI课程,内容涵盖搜索规划、强化学习、概率与贝叶斯网络及机器学习基础,让公众免费学习原本高学费的课程。
@rohanpaul_ai: 一篇来自斯坦福、MIT、哈佛和Anthropic的优秀论文。给出了关于为何大型模型能学习……的清晰训练解释。
一项来自斯坦福、MIT、哈佛和Anthropic的论文解释,大型AI模型能更好地学习稀有技能,因为训练期间它们遗忘更少;其额外容量保护弱学习信号不被常见任务覆盖。
@shedoesai: 如何在不浪费1000多小时的情况下精通AI。没有无用的教程。没有虚假的AI大师。没有信息过载…
精选的AI学习栈,涵盖LLM、智能体、MCP、提示工程、RAG和向量数据库,包含视频、仓库、指南、书籍、论文和课程。同时提供了关于大型语言模型是什么以及它们如何工作的易懂解释。