EMiX:超越单FPGA限制的仿真
摘要
介绍了EMiX,一种可扩展的多FPGA框架,用于仿真超出单FPGA资源限制的多核RISC-V架构,并通过跨八个FPGA的64核系统进行了演示。
暂无内容
查看缓存全文
缓存时间: 2026/05/16 09:38
# EMiX: 超越单FPGA限制的仿真 来源:https://arxiv.org/abs/2604.27012 查看PDF (https://arxiv.org/pdf/2604.27012)HTML(实验性)(https://arxiv.org/html/2604.27012v1) > 摘要:FPGA级仿真是芯片设计预硅验证的关键步骤。然而,仿真大规模多核系统日益超出单个FPGA的硬件资源容量,限制了全系统仿真的可行性。为应对这一挑战,我们提出EMiX,一种可扩展的多FPGA框架,可实现多核RISC-V架构的分布式仿真,超越单FPGA资源限制。EMiX将单片多核设计系统地划分为多个组件,并将其部署在多个互联的FPGA上,有效利用FPGA间互连来平衡可扩展性和性能,而无需进行根本性的RTL重新设计。我们使用八个互联的Alveo U55c FPGA(在核心和FPGA数量上可扩展)原型化了一个64核架构的EMiX,成功演示了包括Linux启动在内的全系统执行。EMiX将作为开源平台发布。 ## 提交历史 来自:Behzad Salami [查看电子邮件 (https://arxiv.org/show-email/5c931f29/2604.27012)] **\[v1\]** 2026年4月29日星期三 10:32:10 UTC(704 KB)
相似文章
FP8就是你所需的一切(第一部分):驳斥硬件FP64作为HPC圣杯的观点
本文认为,在使用Ozaki Scheme II的情况下,FP8张量核心可以替代原生FP64硬件,用于像NVIDIA B300这样的AI优化GPU上的高性能科学计算,以更高的吞吐量实现完全的双精度精度。作者提出了张量-内存均衡模型,并表明在所有工作负载中,模拟的FP64性能可以比原生FP64高出数个数量级。
一人,双内核,与大量RISC-V
QRV Systems的Yuri Zaporozhets在FPGA上构建了一台基于RISC-V的个人计算机和一台大型机,并两次重写了QNX。他最新的操作系统QSOE正在FOSS世界中引起关注。
REAP 剪枝版 Nemotron-3-Super(512→256 experts)+ GRPO 微调 + FP8/AWQ,AIME 2026 90%+,附 Benchmark
社区发布:用 REAP 把 NVIDIA Nemotron-3-Super-120B 剪到 64B,再用 GRPO 做数学强化微调,最后 AWQ/FP8 量化,单卡 H100/RTX PRO 6000 即可跑到 AIME 2026 90%+。
@onusoz: 16路并行 Gemma-4-26B-A4B-NVFP4 运行,每路18输出 token/s,合计300 tok/s 一台配备128GB统一内存的DGX Spark…
@onusoz 展示了在单一 DGX Spark(128GB统一内存)上运行16个并行实例的 NVIDIA 量化版 Gemma-4-26B-A4B-NVFP4 模型,合计达到300 tok/s,展示高并发能力且未使用 flashinfer。
可编程概率计算机,拥有100万p比特
本文介绍了一种可编程概率计算机,通过连接FPGA实现了百万个p比特,在伊辛模型上以超过每秒一万亿次翻转的速度进行吉布斯采样,同时引入了一种设计规则,使其能够突破单芯片限制进行扩展。