@ahall_research: 教学新循环。大学的未来是让每个学生都能设计并构建私有评估以及……

X AI KOLs Timeline 新闻

摘要

作者讲述了在斯坦福商学院教授“自由系统”课程的经历,学生们使用Claude Code和OpenRouter构建私人AI评估和工作流程,强调人类专业知识是在AI驱动的世界中实现个人主权的前提条件。

教学新循环。大学的未来是让每个学生都能设计并构建私有评估和工作流程,使他们能够以对自己有利的方式将专业知识与AI结合,而不仅仅是为前沿模型创造价值。 我一直在斯坦福商学院的新课程“自由系统”中尝试如何做到这一点。以下是今年首次授课时学到的心得: (1) 人类专业知识是构建私有评估的前提条件。在我的课堂上,学生们能够使用Claude Code + OpenRouter设计自己的个人评估...但首先,他们必须知道自己想要评估什么!这正是他们自身经验、价值观和专业知识发挥作用的地方。我们必须加倍重视非AI教学,让学生达到能够将所有这一切带入AI课堂的水平。 (2) 学生需要一个带有具体练习的渐进过程。直接将学生扔进编程代理和评估的深水区对很多人来说并不奏效。相反,我们从更结构化的任务和预建环境开始,然后逐步撤掉辅助轮。这有助于让所有人跟上进度。 (3) 面对面协作和辅导将是这些课程的重要组成部分。学生们通过在同一个房间里完成项目、相互交流以及从助教那里获得及时帮助(一旦出现任何问题就能立即解决),学到了更多东西。 (4) 人们需要一点推动。很多人认为自己无法使用编程代理——但只要稍加推动,他们就会迅速意识到自己可以高效地使用它们。 我非常喜欢Satya关于AI世界主权的愿景。要拥有主权,我们每个人都必须能够更换不同的AI模型,同时不失去让我们能够提供独特价值的“隐性知识”。要做到这一点,我们所有人都必须能够构建这些新循环,让我们能够根据个人目标评估模型,然后朝着这些可衡量的目标逐步优化。 我的梦想是每个人都能做到这一点。这门课是一个很好的初步实验,但还有很多工作要做。明年,我希望将“自由系统”课程打造成面向本科生、MBA和高管们的一项课程,让他们能够要求AI为他们个人负责,并确保我们所有人都能从AI中受益,而不是被前沿模型完全吞噬。 请告诉我你们对这类课程的任何想法,并查看完整帖子——包括学生们精彩的期末项目——请访问此链接: https://freesystems.substack.com/p/teaching-the-new-loop…
查看原文
查看缓存全文

缓存时间: 2026/06/23 08:03

教授新循环。大学的未来在于让每位学生准备好设计和构建私有的评估与工作流,使他们能够将自身专业知识与人工智能相结合,以产生对他们自身、而不仅仅是对前沿模型有利的价值。

我一直在斯坦福商学院的新课程“自由系统“中尝试如何做到这一点。以下是我今年首次教授这门课的经验:

(1) 人类专业知识是构建私有评估的前提。在我的课堂上,学生能够使用 Claude Code + OpenRouter 设计自己的个人评估……但首先,他们必须知道自己想要评估什么!这正是他们自身经验、价值观和专业知识的用武之地。我们必须加倍重视非AI教学,让学生能够将所有这些带到AI课堂中。

(2) 学生需要循序渐进的实操练习。直接让学生一头扎进编码代理和评估的深水区,对很多人来说行不通。相反,我们从更结构化的任务和预构建环境开始,然后逐渐撤去辅助。这有助于让所有人都跟上进度。

(3) 面对面协作与辅导将是这类课程的重要组成部分。学生们在同一间教室里共同完成项目,互相倾听进展,并在遇到问题时立即得到助教的帮助,这样他们学到了更多。

(4) 人们需要一点推动。很多人认为自己无法使用编码代理——但只需稍微鼓励,他们很快就能意识到自己可以很好地利用它们。

我非常欣赏萨提亚关于AI世界中主权的愿景。要做到主权自主,我们每个人都必须能够更换不同的AI模型,而不会失去那些让我们能够提供独特价值的“隐性知识“。为此,我们都必须能够构建这些新循环,让我们根据个人目标评估模型,然后朝着这些衡量目标不断进步。

我的梦想是每个人都能做到这一点。这门课是一个很好的初步尝试,但还有很多工作要做。明年,我希望将“自由系统“课程打造成面向本科生、MBA和高管的一个项目,让他们能够使AI对自己负责,并确保我们所有人都能从AI中受益,而不是被前沿模型吞噬。

请将您对这类课程的任何想法告诉我,并点击以下链接查看完整文章——包括学生们令人惊叹的期末项目:

https://freesystems.substack.com/p/teaching-the-new-loop…


教授新循环

来源:https://freesystems.substack.com/p/teaching-the-new-loop “没有人类的引导,计算只会原地打转”

——萨提亚·纳德拉

每一次前沿AI模型的发布都会带来令人惊讶的新能力,似乎缩短了人类独特性的列表,并摧毁那些以为自己已经与这项强大新技术区隔开来的初创公司和成熟企业。

在两周前发表的一篇引人注目的文章 (https://x.com/satyanadella/article/2066182223213293753) 中,萨提亚·纳德拉评估了这一现状,并提出了一个问题:在一个AI模型不断吸收人类和公司的专业知识并将其作为商品出售的世界里,任何组织如何才能蓬勃发展?纳德拉告诉我们,这不仅是商业问题,更是政治经济学的生存问题,因为它关系到社会契约以及我们对社会能够为所有人服务的共同信任。

他对这个难题的回答是,公司必须将自身的人类专业知识与AI相结合,将其私有知识编码到模型评估和训练环境中,这些环境由公司自己拥有,而非前沿实验室。纳德拉设想了一个新的“循环”,公司将其自身的工作流程和积累的判断转化为每次使用都会改进的系统,并根据自己的标准而不是公共排行榜来衡量结果,正如他所说:

“私有评估应能捕捉模型是否在真正改善对业务重要的成果。”

这些私有评估使公司能够保持主权,因为它们允许公司(而非实验室)拥有其专业知识。纳德拉解释道:“一家公司应该能够更换‘通用型’模型,而不会丢失已构建到其学习系统中的‘公司老手’专业知识。这是未来时代你能否控制并拥有主权的关键‘测试’。”

纳德拉的见解远远超出了公司范畴:事实上,整个社会都存在同样的机遇。想想民主国家的公民、我们的政治领袖、我们的大学……我们都需要一种方式来利用AI,同时不被其吸收和俘获。我们应该能够在工作和生活中更换一个前沿模型,而不会丢失我们积累的专业知识。这个新循环就是实现这一目标的方式。

那么,我们都应该学习如何构建它呢?这并非任何标准课程的内容。但我坚信,它必须被纳入课程。

我这样说,部分是因为今年我在教学中对此进行了尝试。就在纳德拉发表呼吁公司构建私有评估的文章前几周,我让我在斯坦福商学院新开设的“自由系统”课程的学生们做了完全相同的事情 (https://freesystems.substack.com/p/an-army-of-citizens-building-evals)。在拥有 Claude Code 订阅、OpenRouter API 积分以及几周的练习之后,我的所有学生都在一次三小时的课堂中创建了他们个人评估的初稿。

每位学生都确定了一个他们关心的标准——模型在辩论有争议话题时的谄媚程度、模型提供投票建议的好坏、模型是否理解跨语言的关键文化细微差别等等——然后根据他们的个人信念设计了一个评分模型回答的规则。接着,他们构建了一个排行榜,比较不同领先AI模型按照他们的衡量标准的表现。结果令人惊叹!但我们还没有完成。

一旦他们能够用自己的个人标准来衡量模型,我们就在本学期剩余时间里进一步推进——学生还能用这种能力做什么?事实证明,很多。他们的期末项目很好地展示了纳德拉所描述的未来可能是什么样子。总的来说,它们就像一本在现实世界中构建这些新循环的初步指南。

以下是我们课堂上那个未来的样子:十五个期末小组项目,涵盖金融、治理、媒体和安全等领域,其中几个直接源于学生几周前构建的个人评估。

虽然许多项目核心是评估,但它们超出了我们在课堂上构建的评估,因为它们不仅仅是排行榜;相反,这些评估被嵌入到更广泛的工具中,这些工具会根据信息执行操作——无论是提出新推荐、帮助用户完成操作、提供更好的建议等等。这就是它们开始向我们展示新循环会是什么样子的方式。

我在Claude的大量帮助下,按主题对它们进行了分组。你可以在以下网站 (https://remarkable-warmth-production-375d.up.railway.app/) 查看所有项目。

金融与委托决策

  • AI银行挤兑模拟器 (Shang Jing Chia) — 由LLM代理以不同角色进行AI驱动的银行挤兑实时模拟;让你观察级联效应并检查每个代理的推理过程。
  • 跨市场套利 (Graham Griffin, Ethan Romer) — 检测从Polymarket到Kalshi的信息交易传播,衡量透明链上市场与不透明受监管市场之间的延迟。
  • RegFi合规检查器 (Bernardo Herzer) — AI工具,自动对金融AI系统进行监管合规检查,以减少人工审查负担。

媒体与框架构建

  • 标题真实性 (Jenna Jokhani) — 评估标题是否忠实反映文章内容,以及模型能否检测扭曲或耸人听闻。
  • 政治框架万花筒 (Milly Wong) — 粘贴一篇评论文章,看它落在284篇文章(跨越7个媒体)的3D地图中的位置,通过UMAP嵌入到384维空间,并分别提供话题和世界观视角。
  • 新闻框架仪表板 (Eddy Jiang) — 将一篇文章输入Claude、GPT、Gemini、Grok和Llama,量化它们在行动者显著性、情感负荷、上下文包含度和模糊密度等方面的框架差异。

对齐、安全与治理

  • LLM冒名顶替者:五方委员会 (Raymond Llata) — 社交推理游戏,一个不对齐的AI试图说服对齐代理委员会采纳一项自私政策;作为多智能体对齐鲁棒性的代理。
  • 隐写注入演示 (Yuanxin Ma) — 测试15个前沿模型上的11种隐藏文本攻击类型(3600+ API调用),看模型是否被推动产生有偏见的产品排名。
  • ChatGPTween (Jaxon Gonzales, Juan Sandoval) — 将家长问卷或引导式对话转化为孩子聊天机器人的个性化AI“宪法”;对话式宪法拒绝了基于多项选择题的宪法未能通过的24次对抗性提示。

个人工具与模型选择

  • 模型签名 (Navya Agarwal, Zoya Fasihuddin, Diya Ahuja) — 通过十个任务类别的盲测A/B/C入门,构建个人模型偏好热力图,然后将每个查询路由到最匹配的模型。
  • Streamline (Leticia Auriemo, Bennett Evans Zytko, Alec Profit) — 对话式意义构建仪表板,构建个性化情报信息流,帮助用户理解复杂问题。
  • Rundown (Prakhar Goel) — 连接Slack,将一周的频道活动浓缩为一分钟摘要。
  • ResumeScope (Jonas Pao) — 简历审查平台,AI招聘代理模拟真实招聘人员的阅读方式,预测注意力和评分。

资本集中与AI基础设施

  • 情境无意识 (Vivek Yarlagedda, Kathy Shao, Shawn Gregory, George Zhang) — AI堆栈交互地图,涵盖92家公司和297笔交易,可按层(计算、网络、原材料、电力、资本)和交易类型筛选,追踪资金流向的集中区域。
  • AI的隐性成本 (Natalie Hampton, Quincy Stone) — 地图显示AI计算资源在物理上的集中地点,以及哪些社区承担了水、电、土地和污染成本;报告显示86%的已映射容量位于富裕中心,2024年70%的数据中心电力用于美国和中国。

我从这次教授新循环的首次实验中得出了四个主要教训。

教训1:人类专业知识和批判性思维是必要前提

项目的成功很大程度上是因为它们基于学生已经了解并深切关心的事物。这项工作非但没有让学生将思考外包出去,反而要求更多的思考,这就是为什么常见的“AI侵蚀批判性思维”的担忧在这里是颠倒的——在这里,批判性思维是AI之所以有价值的东西。这意味着,未来的大学不能提供AI密集型课程;相反,这些课程应该放在教授基本批判性思维技能和领域知识的课程之后

教训2:学生需要循序渐进的引导和具体例子

没有人能在第一天就走进课堂并有效指挥一群代理。学生需要一个循序渐进的流程、结构化的早期作业以及在独立探索之前可以模仿的具体例子。从外部看像是突然掌握的能力,实际上是仔细安排的顺序:先给人足够的脚手架让他们站稳,然后一旦站稳就将其移除。

教训3:面对面协作和辅导至关重要

我发现当学生在同一个房间里时,工作进展要好得多,他们可以看一眼别人的肩膀,借用两座之外的人刚想出的技巧,并在遇到问题时立即得到帮助,而不是三天后通过电子邮件。一个能在30秒内诊断出故障代理的现场导师比任何文档都更有价值,因为这些工具抛出的失败仍然足够奇怪,以至于一个人很少能独立知道该问什么问题。

教训4:每个人都需要正确的推动来开始

我观察到的最重要的事情是,很多人不知道他们不知道什么——他们假设掌握新循环会比实际困难得多,而这个假设阻止了他们开始。有一个简单、低压力的方式来启动他们自己的实验,有助于让人们动起来。

尽管纳德拉的文章主要是一篇商业文章,但它也可以被读作一篇政治经济学文章。他担心一个AI模型“吞噬它们看到的一切”的未来,并预测这样的世界无法导致可持续的政治均衡。“一个掏空整个行业的AI未来,在社会上是得不到许可的,”他警告说。

相反,他认为如果公司能够构建它们的新循环,那么它们“将为自己以及周围的经济创造价值。员工会看到自己的专业知识得到放大,他们的判断成为系统的一部分,使其可复制和可扩展,而收益则归于他们周围的公司和社区。”

这将是我们维持AI时代自由社会所需的生态系统。我们需要每个人都能使用AI,根据他们的私有评估来衡量它,相应地更新,并捕获价值。从某种意义上说,这是教育自由人民的最古老论点,只是被刷新了。1822年,詹姆斯·麦迪逊在写给一位正在建设肯塔基州公立学校和大学的立法者时 (https://founders.archives.gov/documents/Madison/04-02-02-0480) 明确表示:“一个打算自己治理的人民,必须用知识赋予他们的力量武装自己。”循环就是自由人民现在武装自己的方式,一个既不能使用这些系统也不能为自己衡量它们的人,只是将这种力量拱手让给了模型的所有者。

因此,我希望世界上每个人都能学会这样做。我们需要向高管、MBA、大学生甚至高中生教授如何做到这一点。我们不仅需要“一支公民评估大军”(如我之前所说);我们还需要这支大军理解如何将这些评估转化为具体的工具和决策,让AI为我们服务,而不是反过来。

这是一个远大的目标,我将分步实施。明年,我将为高管、MBA和本科生开设一系列新课程,名为“领导者AI工具”,旨在教授人们这个新循环。如果我们能成功,我希望将其扩展到斯坦福之外,并希望世界各地的其他人也能同时开发类似的想法和实验,这样我们都能从新循环中受益,并确保前沿模型不会吞噬我们所有人。

关于此帖的讨论

准备好了解更多了吗?

相似文章