模型原生计算架构：通过计算机架构视角展望未来系统架构

arXiv cs.AI 2026/06/02 04:00 论文

摘要

本文提出了一种模型原生计算架构，通过计算机架构的视角展望未来系统设计。

arXiv:2606.00288v1 公告类型：新摘要：大型语言模型正经历从模型技术到系统技术的转变。随着开发者使用Codex、Claude Code、AutoGPT及相关智能体来编写代码、管理项目和执行多步骤任务，缓存复用、上下文管理、智能体调度和权限控制等反复出现的工程问题越来越类似于经典的计算机系统问题。本文将此类比发展为一项前瞻性综述。我们将计算机架构的概念映射到新兴的模型原生技术栈，并回顾了LLM即操作系统、内存管理、智能体框架、工具协议、多智能体协调、认知架构和安全治理等方面的工作。我们认为，这些方向处理的是同一系统的不同层次，但缺乏统一模型。为填补这一空白，我们提出了智能计算架构模型（ICAM），这是一个具有明确接口契约和设计公理的六层模型原生计算框架。ICAM通过双平面视图解决了关于LLM更像CPU还是操作系统的明显张力：一个关注可计算内容的概率执行平面，和一个关注应计算内容的确定性控制平面。我们进一步引入了三条设计定律：用于KV缓存复用和推理加速的语义局部性定律、用于有限窗口和注意力衰减下有效工作集的上下文预算定律，以及多智能体协作收益递减的智能体加速定律。我们根据已发表的系统级数据验证了这些定律，并将其与近期关于智能体软件实践的实证相关联。最后，我们指出了此类比失效之处，并勾勒了模型原生计算的研究路线图。本文为概念性和综述性贡献，未报告新实验。

查看原文

查看缓存全文

缓存时间: 2026/06/02 15:46

# 模型原生计算架构：通过计算机架构视角展望未来系统架构
来源：https://arxiv.org/abs/2606.00288  
文献工具

## 文献与引用工具

文献浏览工具 切换

代码、数据与媒体

## 本文相关的代码、数据与媒体

演示

## 演示

相关论文

## 推荐与搜索工具

关于 arXivLabs

## arXivLabs：与社区合作者共同开展的实验项目

arXivLabs 是一个框架，允许合作者直接在我们的网站上开发和共享新的 arXiv 功能。

与 arXivLabs 合作的个人和组织都已接受并认可我们关于开放、社区、卓越以及用户数据隐私的价值观。arXiv 致力于这些价值观，并且只与遵守这些价值观的合作伙伴合作。

有一个能为 arXiv 社区增加价值的项目创意？**了解更多关于 arXivLabs** (https://info.arxiv.org/labs/index.html)。

模型原生计算架构：通过计算机架构视角展望未来系统架构

相似文章

迈向原生多模态建模：路线图

从应用层模拟到原生元架构：结构张力作为异构AI进化的内源性驱动

Sovereign OS Architecture：确定性人工智能、体积共振和生物模拟中的范式转变

面向边缘嵌入式AI代理系统的模块化架构

世界模型：架构、方法、推理范式与应用的全面综述

提交意见反馈