我在单页上手绘了完整的 AI 技术栈……而其中大部分并非模型。

Reddit r/singularity 新闻

摘要

作者提出了一种五层 AI 技术栈金字塔——基础、数据、模型、智能体和应用程序——以论证进步不仅仅取决于模型能力。文章邀请讨论评估和可解释性在这一架构中的位置。

大多数关于“AI 进展”的讨论都停留在同一层:模型。更大的模型、更小的模型、新的基准测试,然后重复。但模型坐落在一个技术栈之上,而真正推动发展的正是这个技术栈。我将其绘制为一个金字塔:1. **基础** ——> 电力、芯片、光纤、冷却、冗余,以及那些在物理上维持其运行的人。2. **数据** ——> 书籍、代码、图像、音频、传感器日志、人类反馈,以及那些无人提及的清洗和标注管道。3. **模型** ——> 研究、训练、微调、评估、安全、对齐。4. **智能体** ——> 副驾、工作流自动化、规划器、编码工具、客户支持、机器人。5. **应用程序** ——> 医学、科学、教育、能源、交通、创意。任何一层的突破都能推动整个技术栈向前发展。任何一层的瓶颈都会阻碍其发展。如果数据中心没有电力、没有干净的数据来训练、没有智能体外壳来部署它,也没有真正采用它的领域,那么 GPT-6 就不重要。我有两件事不确定并希望讨论:* **评估/基准测试**是否应该成为模型和智能体之间的独立层?它足够关键。* **可解释性**到底应该放在哪里——在模型层内部,还是与安全性并行的独立事物?你会删减、合并或添加什么?
查看原文

相似文章

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2057153343081111582

X AI KOLs Timeline

UIUC、Meta和斯坦福大学联合发布的一份100页调查报告引入了人工智能代理的三个 harness 层(接口、机制、Scaling),认为大多数代理失败源于 harness 问题而非推理缺陷,并提供了一个用于审计代理堆栈的分类体系。

关于 AI 智能体的真实内情

Reddit r/AI_Agents

一位资深从业者分享了将 25 个以上 AI 智能体部署到生产环境的经验教训,指出记忆、编排和可审计性远比模型选择重要。文章详细介绍了上下文丢失、静默成本循环等常见故障模式,并推荐了包含 Claude Sonnet 4、Pydantic AI 以及 Octopodas 等专用记忆层的技术栈。