模型原生计算架构:通过计算机架构视角展望未来系统架构
摘要
本文提出了一种模型原生计算架构,通过计算机架构的视角展望未来系统设计。
arXiv:2606.00288v1 公告类型:新
摘要:大型语言模型正经历从模型技术到系统技术的转变。随着开发者使用Codex、Claude Code、AutoGPT及相关智能体来编写代码、管理项目和执行多步骤任务,缓存复用、上下文管理、智能体调度和权限控制等反复出现的工程问题越来越类似于经典的计算机系统问题。本文将此类比发展为一项前瞻性综述。我们将计算机架构的概念映射到新兴的模型原生技术栈,并回顾了LLM即操作系统、内存管理、智能体框架、工具协议、多智能体协调、认知架构和安全治理等方面的工作。我们认为,这些方向处理的是同一系统的不同层次,但缺乏统一模型。
为填补这一空白,我们提出了智能计算架构模型(ICAM),这是一个具有明确接口契约和设计公理的六层模型原生计算框架。ICAM通过双平面视图解决了关于LLM更像CPU还是操作系统的明显张力:一个关注可计算内容的概率执行平面,和一个关注应计算内容的确定性控制平面。我们进一步引入了三条设计定律:用于KV缓存复用和推理加速的语义局部性定律、用于有限窗口和注意力衰减下有效工作集的上下文预算定律,以及多智能体协作收益递减的智能体加速定律。我们根据已发表的系统级数据验证了这些定律,并将其与近期关于智能体软件实践的实证相关联。最后,我们指出了此类比失效之处,并勾勒了模型原生计算的研究路线图。本文为概念性和综述性贡献,未报告新实验。
查看缓存全文
缓存时间: 2026/06/02 15:46
# 模型原生计算架构:通过计算机架构视角展望未来系统架构 来源:https://arxiv.org/abs/2606.00288 文献工具 ## 文献与引用工具 文献浏览工具 切换 代码、数据与媒体 ## 本文相关的代码、数据与媒体 演示 ## 演示 相关论文 ## 推荐与搜索工具 关于 arXivLabs ## arXivLabs:与社区合作者共同开展的实验项目 arXivLabs 是一个框架,允许合作者直接在我们的网站上开发和共享新的 arXiv 功能。 与 arXivLabs 合作的个人和组织都已接受并认可我们关于开放、社区、卓越以及用户数据隐私的价值观。arXiv 致力于这些价值观,并且只与遵守这些价值观的合作伙伴合作。 有一个能为 arXiv 社区增加价值的项目创意?**了解更多关于 arXivLabs** (https://info.arxiv.org/labs/index.html)。
相似文章
迈向原生多模态建模:路线图
本文提出了一份正式的路线图,用于从晚期融合多模态方法向统一Transformer框架内的原生多模态建模(NMM)转型,根据输入-输出对偶性对现有模型进行分类,并系统性地讨论了架构协调、数据整理、训练方案和评估。
面向边缘嵌入式AI代理系统的模块化架构
提出了一种面向边缘嵌入式AI代理系统的模块化参考架构,将设备端代理与云端增强代理解耦,并引入治理层以确保安全性和策略执行。
世界模型:架构、方法、推理范式与应用的全面综述
关于世界模型的全面综述,提供了一个多轴分类体系,涵盖架构、方法、推理策略以及跨AI领域的应用,包括Dreamer、MuZero和Sora等关键系统。
SenseNova-U1:基于 NEO-unify 架构统一多模态理解与生成
本文介绍了 SenseNova-U1,这是一种统一的多模态架构,整合了理解与生成任务。我们发布了两个变体(8B 和 30B),在感知能力和图像合成方面均表现出竞争力的性能。
@dair_ai: Meta的新论文:Agentic Discovery of Neural Architectures。这是一个热门的新研究领域!请密切关注。
Meta的新论文介绍了一个智能体系统,它能在24小时的计算预算内自主发现神经架构,在350M、1B和3B规模上超越Llama 3.2。