DIY RISC-V ultracluster
摘要
一位硬件爱好者使用8192个RISC-V微控制器(CH570)构建了一个浸没式冷却的超级集群,并分享了在时钟、SPI信号和产能方面的挑战与解决方案。
<p><a href="https://lobste.rs/s/dbopp5/diy_risc_v_ultracluster">Comments</a></p>
查看缓存全文
缓存时间: 2026/07/04 18:45
TL;DR:一位硬件爱好者用8192个RISC-V微控制器(CH570)打造了一个浸没式冷却的超级集群,目标是最终达到65536核心,过程中克服了时钟、SPI信号和产能瓶颈。
## 从疯狂想法到实际规划
视频作者之前做过一个M.2集群,得到了Altium的赞助和预算支持,于是决定做一个规模完全不同的集群。灵感来自WCH的CH570微控制器:13美分一颗,运行在100MHz,带有12KB SRAM、乘法器、原生USB和无线电。作者最初想实现每个像素对应一个MCU——即64×64=4096像素的QVGA分辨率,需要65536个MCU。65536 × 13美分 ≈ 8500美元,加上WCH CTO Patrick免费提供了10000颗MCU,这个计划似乎可行。
但65536这个数字带来严重问题:功耗。每个MCU消耗约10mA @ 3.3V,总计650A、2kW。欧洲插座最大功率约3kW,99.9%电能变成热量。作者决定采用浸没式冷却,并用半米直径的亚克力容器容纳“刀片”板卡。
## 刀片设计:1K核心模块
每个刀片包含32行×32列 = 1024个小MCU,以及32个行控制器(更大的带FPU的核心)。作者选择SPI作为总线,每路SPI挂32个MCU,每个行控制器提供32个独立片选引脚。为了信号完整性,使用了六层PCB:第二层和第五层为连续地平面,信号线夹在内层并用地线隔离。电源分配使用底层(更厚铜箔)通过铜区域给每列的LED和MCU供电。
每个MCU还配有一个1×1mm的共阳极RGB LED(红、绿、蓝三个引脚,MCU作地线)。时钟源本想省去晶振,由行控制器的PWM提供32MHz时钟,但发现时钟信号严重失真——因为CH570的时钟引脚最大额定电压仅1.4V,且没有旁路模式选项。被迫在每个MCU旁增加晶振封装,导致重新设计测试板。
## 错误与修复
### 时钟与晶振
最初测试时部分MCU拒绝启动,触摸MCU能启动。检查发现外部时钟信号被切得支离破碎,CH570时钟引脚耐压不够。被迫改为每个MCU使用独立晶振,重新设计PCB。
### SPI通信错误
首次完整刀片测试时,发现层0与层1之间的SPI无法通信。用示波器看到Mosi信号在片选激活后电压减半——因为MCU之间有50Ω电阻,两个MCU同时驱动总线。最终发现是Mosi和Miso接反了。由于线上串联了电阻,可以用飞线修复。修复后SPI最高稳定工作在约15Mbps,7.5Mbps时有偶发错误。
## 编程自动化
为了给成千上万个MCU编程,作者使用了Bumbo打印机(无USB,通过Home Assistant控制)改装成龙门编程机器。Y轴移动弹簧针臂接触背面的编程焊盘,Python脚本调用OpenOCD作为子进程逐个上传固件,并扫描输出来确认成功。
## 底板与最终组装
最初设计64刀片(65536核心),但制造商无法处理每板超10000个过孔和5000个元器件,只好将刀片拆分为两块并排放置。接着制作连接16个刀片的底板(128刀片版本稍后扩展)。底板供电使用XT60连接器,并从海盗船3kW PC电源取电,通过Murata DC-DC降压转换器(95%效率,30A能力)提供3.3V。作者共做了20个这样的转换器。
最终组装了16个刀片(16284核心的初始版本),底板使用了0.1mm线宽/间距的制造工艺。一个小失误:编程焊盘放在了四级MCU下面,于是通过QFN底部裸露焊盘飞线解决。
## Altium工具的优势
作者强调Altium Designer的几个关键功能:
- **多通道设计**:使用`repeat`关键词避免手动复制子图纸。
- **实时DRC规则检查**:自动高亮违反规则。
- **自动阻抗匹配**:设置层叠后自动计算走线宽度。
- **极坐标网格**、**最大额定电流检查**、**按属性过滤**等。
这些工具对于管理如此复杂的项目(每板数千元件)至关重要。
---
Source: [YouTube视频 DIY RISC-V ultracluster](https://youtube.com/watch?v=qMR3IXF2sWw)
相似文章
SBC集群性价比极低,但玩起来很有趣
对DeskPi Super4C(一款四节点树莓派CM5集群板)的评测,着重介绍了其改进的远程管理和冗余电源/以太网,同时指出SBC集群性价比不高,但对于爱好者进行HPC折腾来说却很有趣。
一人,双内核,与大量RISC-V
QRV Systems的Yuri Zaporozhets在FPGA上构建了一台基于RISC-V的个人计算机和一台大型机,并两次重写了QNX。他最新的操作系统QSOE正在FOSS世界中引起关注。
集群三台Jetson Nano Orin Super
作者宣布了一篇新的博客文章,内容是关于将三台Jetson Nano Orin Super组成集群,用于分布式训练和推理,延续了一个系列,旨在帮助人们使用易于获取的硬件构建小型计算集群。
将树莓派集群用于学习分布式训练/推理
一篇博客文章指导读者如何搭建树莓派集群进行分布式训练和推理,这是系列教程的一部分,旨在利用实惠的硬件让分布式AI变得可及。
RISC-V路由器
一款基于RISC-V的路由器的众筹活动目前已完成目标的10%,有89位贡献者。