@mdancho84: 斯坦福刚刚发布了一份457页的AI报告,其中包含大量关于成本下降、效率提升、基准测试和应用普及的数据。……
摘要
斯坦福发布了长达457页的AI报告,内容涵盖成本下降、效率提升、基准测试和应用普及。作者在推特讨论了关键图表及其对职业发展的影响。
查看缓存全文
缓存时间: 2026/06/16 03:15
斯坦福刚刚发布了一份长达 457 页的 AI 报告。
里面全是数据:成本下降、效率提升、基准测试、应用普及。
这份报告就是你进入 2026 年的职业作弊码。
我挑出了最重要的图表 + 它们对你的职业意味着什么:
首先:这不是“AI 炒作”。
而是经测算的趋势:什么东西在变便宜、什么东西在变好、什么东西正在经济和监管中扩散。
(收藏这个。你会反复用。)
- 成本 + 效率
2025 年不声不响的大故事:AI 正在大幅变得更便宜 + 更高效。
报告估计价格性能每年提升约 30%,能效每年提升约 40%。
这就是为什么 AI 正从“演示”变成“默认”。
- 算力仍在爆炸式增长
即使效率在提升,前沿模型的训练强度也在加大:
AI 指数指出,知名模型的训练算力大约每 5 个月翻一番(数据集规模也在快速扩大)。
翻译一下:规模持续扩展,但只有少数玩家负担得起。
- 谁在打造前沿模型?
工业界正主导“知名模型”:
2024 年约 90% 的知名 AI 模型来自工业界(2023 年约 60%)。
职业影响:前沿越来越成为产品 + 基础设施的游戏。
- 基准测试动态(没人谈论的部分)
前沿性能在趋同:
Chatbot Arena 上排名第 1 和第 10 的模型差距在一年内从 11.9% 缩小到 5.4%。
所以“模型选择”的重要性低于工作流 + 评估 + 数据。
- 开源与闭源差距在缩小
开源权重模型正快速追赶。
AI 指数报告显示,Chatbot Arena 上领先的开源权重模型与闭源权重模型之间的差距已缩小到约 1.70%(截至 2025 年 2 月)。
这改变了构建策略(和预算)。
- 新基准测试很快被碾压
报告指出,从 2023 年到 2024 年,MMMU / GPQA / SWE-bench 等硬基准测试的成绩大幅跃升:提升了 19 到 67 个百分点。
但是……这导致了基准测试问题。
- 基准测试问题
随着基准测试饱和,实验室创造了更难的测试。
AI 指数指出,许多基准测试构建得不好,标准化评估仍然是个空白。
职业影响:能够评估 + 验证模型的人将变得稀缺且有价值。
- 应用加速(且全球格局在变)
全球组织 AI 使用在增加,各地区正在追赶。
政策要点指出,大中华区组织 AI 使用同比增长 27 个百分点,欧洲增长 23 个百分点。
这正演变成一场全球实施竞赛。
- 监管大幅加强
各国政府正在加码:
在美国,2024 年推出的 AI 相关联邦法规数量翻了一番以上(来自 42 个机构的 59 项法规)。
各州通过的 AI 法律数量较 2023 年翻了一番以上。
- 接下来做什么(职业行动手册)
如果你是 2026 年的数据科学家,杠杆技能正在转移:
- 评估(基准测试混乱 → 你需要自己的评估框架)
- 工作流工程(智能体 + 管道胜过“模型挑选”)
- 效率 + 成本意识(推理经济学就是产品)
- 治理(隐私、合规、审计追踪)
想学习如何构建 + 交付 AI 和数据科学项目(企业 2026 年真正想要的)?
6 月 24 日,我将举办一场免费研讨会,帮助你开始使用 Python 完成 AI + DS 项目。
在此注册(500 个席位):https://learn.business-science.io/ai-register 
总结!在接下来的 24 天里,我将分享帮助我成为 AI 数据科学家的 24 个概念。
如果你喜欢这个系列:
- 关注我 @mdancho84 获取更多内容
- 转发下面的推文,与你的受众分享本系列
相似文章
我评估了250+个真实的AI落地案例,有些结果令我意外...
作者分享了在评估250多个真实AI落地案例中的洞察,指出工程和财务领域处于采用领先地位,而大多数成果侧重于提升速度,而非降低成本或增加收入。
AI吞噬世界(2026年春季)[pdf]
一份全面的报告或文章,审视人工智能在各行各业的普遍影响,很可能讨论了截至2026年春季AI的快速普及和变革潜力。
人工智能指数报告2026
第九版人工智能指数报告分析了AI进步与社会准备之间的差距,新增了对推理、安全、经济价值、劳动力影响的评估,并设有专门章节讨论AI在科学与医学中的应用。
@allen_explains: 大学收取数千元教授人工智能。斯坦福大学刚刚将同样能带来高收入的人工智能技能以90分钟的免费课程发布在线……
斯坦福大学已发布免费在线资源,在90分钟内教授高收入的人工智能技能,为早期观看者带来显著优势。
斯坦福大学研究了51个真实AI部署案例,发现71%与40%的生产率差距——以下是两组之间的区别
斯坦福大学研究人员分析了51个真实世界的AI部署案例,发现使用代理型AI(完全自主)的公司生产率中位数提升达71%,而辅助型AI仅为40%,且只有20%的公司达到了更高层级。