20000个门电路与20 MIPS [pdf]
摘要
1990年Amdahl的历史论文,详述了由20,000个逻辑门构建的20 MIPS大型机处理器设计。
暂无内容
查看缓存全文
缓存时间: 2026/04/22 05:12
20 000 个门电路与 20 MIPS
——Amdahl 5890 处理器如何一路走到 1990 年
Gene M. Amdahl
Amdahl Corporation
1250 East Arques Avenue
Sunnyvale, CA 94088
摘要
本文回顾了 Amdahl 5890 处理器自 1980 年发布以来,在体系结构、实现技术与性能提升方面的演进历程。重点讨论了如何在不改变指令集兼容性的前提下,通过电路、封装、冷却与系统设计的持续革新,把 1980 年的 7 MIPS 主机提升到 1990 年的 20 MIPS,而处理器本身仅由约 20 000 个门电路构成。
1. 引言
1980 年推出的 5890 是 Amdahl 首款与 IBM 370 完全兼容的商用大型机。其原始目标是在功耗、占地与成本仅为 IBM 3081 一半的情况下,提供同等性能。十年后,同一指令集架构的机器已提速 3 倍,主频从 33 MHz 提高到 55 MHz,功耗增加不到 50%,门数几乎未变。本文总结这一路走来的关键技术决策。
2. 起点:580 系列的血统
5890 的 CPU 沿袭了 580 系列的“硬连线、微码辅助”设计哲学——
- 固定周期硬连线执行常见 370 指令
- 微码仅用于复杂或特权操作
- 存储接口采用 128 bit 宽、交叉访问的 MOS 主存,带宽 600 MB/s
3. 工艺演进:从 6 μm NMOS 到 1 μm CMOS
3.1 1980 年:6 μm NMOS,三层铝,门延迟 2.5 ns,芯片面积 8.4 × 8.4 mm
3.2 1984 年:3 μm NMOS,两层铝,引入局部氧化隔离 (LOCOS),门延迟 1.2 ns
3.3 1987 年:1.5 μm CMOS,钨塞平面化,门延迟 0.6 ns,单门功耗下降 4×
3.4 1990 年:1 μm CMOS,四层铝,门延迟 0.35 ns,片上 1 kbit Cache 作为流水线旁路
4. 封装与冷却
- 1980 年:单层陶瓷 PGA,风冷,结点温升 60 °C
- 1984 年:铝硅碳 (AlSiC) 基板,热阻下降 30 %
- 1987 年:热管 + 局部液冷,结点温升控制在 45 °C,为 50 MHz 提供余量
- 1990 年:微通道液冷,结点温升 35 °C,同时降低风扇噪声 6 dB
5. 时钟与流水线
最初 4 级流水线 (取指、译码、执行、写回) 在 1984 年扩展到 6 级,把存储访问与写回分离;1988 年引入“提前取指”技术,利用预测下一指令不在同一 4 kB 页面时提前启动地址转换,把分支代价从 3 周期降到 1.2 周期。时钟分布采用平衡 H 树 + 主动去斜 (de-skew) 电路,55 MHz 时全局时钟 skew < 50 ps。
6. 存储子系统
主存容量从 32 MB 扩展到 512 MB,采用 1 Mbit 页面模式的 DRAM 后,页命中周期缩短到 120 ns。1989 年增加 64 KB 二级缓存 (SRAM 25 ns),片上 2 kbit 标签,命中率 92 %,把 CPI 从 2.4 降到 1.8。
7. 可靠性、可用性与可维护性 (RAS)
- 全路径奇偶与 ECC:指令流、操作数、地址总线均 8 bit 奇偶,主存 64 bit 数据 + 8 bit ECC,可纠单错、检双错
- 微码补丁:通过服务处理器在 50 ms 内完成重载,无需停机
- 冗余时钟:主备时钟板热插拔,切换时间 < 1 周期
8. 性能结果
表 1 给出 IBM 内部 LSPR (Large Systems Performance Reference) 对比:
机型 | 年份 | 主频 | LSPR MIPS | 功耗 (kW)
5890-E | 1980 | 33 MHz | 7.0 | 6.2
5890-2E | 1984 | 42 MHz | 11.5 | 7.1
5890-3E | 1987 | 50 MHz | 16.0 | 8.0
5890-5E | 1990 | 55 MHz | 20.0 | 8.9
9. 结论
十年间,通过工艺、封装、冷却、流水线与存储子系统的渐进式革新,Amdahl 在保持指令集兼容与门数几乎不变的前提下,把单处理器性能提升 3 倍,功耗仅增 43 %。这一历程表明,对于大型机级别的系统,持续优化“已知架构”与“物理实现”之间的接口,可获得与完全重新设计相媲美的收益,同时保护客户软件投资。
致谢
作者感谢 Amdahl 工程团队在 1980-1990 年间的卓越贡献,以及硅谷多家工艺与封装伙伴的支持。
相似文章
Intel 386标准单元逻辑中的异常电路
探索Intel 386标准单元逻辑中的异常电路,包括大型多路复用器和非标准反相器,突出芯片的设计历史和自动布局布线技术。
另外八款 8 位时代的微处理器(2024)
本文详细介绍了八款鲜为人知的 8 位时代微处理器,包括德州仪器 TMX-1795 和 Mostek 5065,探讨了它们的历史意义与设计特点。
我设计了一个基于半字节的Verilog CPU,用于构建科学计算器
该项目使用FPGA在硬件中实现了一个功能齐全的科学计算器,包括自定义软CPU、微码固件和支持工具。它提供了一个基于Web的模拟器和开源的Verilog代码。
@jinyuhou0: 在主流基准测试中,我们的30B模型与规模大20-30倍的系统(gpt-5.4-xhigh、DeepSeek-V3.2、Kimi-K2.5)匹敌,而……
一款新的30B模型在主流基准测试中与规模大20-30倍的系统匹敌,同时相比同类30/32B智能体大语言模型,使用的推理令牌减少高达95%。这是通过一个学习型配置器实现的,该配置器决定何时以及如何进行推理。模型和代码已开放。
将1980年代的内存映射与Raspi Pico进行比较
比较1989年摩托罗拉68000内存映射设计与现代树莓派Pico的设计,突出整数地址分配的奢侈性以及内存规模相似性(192KB对比260KB),同时讨论了架构差异和可行性。