USB4 RDMA 似乎可行
摘要
通过 Thunderbolt 和 Strix Halo 演示了基于 USB4 的 RDMA 实验性实现,可能实现与任何 USB4 主机的高速数据传输。
刚发现这个博客:https://blog.hellas.ai/blog/thunderbolt-ibverbs/ 实验性的 RDMA 实现,在两个 Strix Halo 上演示。快速搜索了一下,之前似乎没有发布过?这可能意义重大,因为它应该能适用于任何 USB4 主机。
相似文章
@zcbenz:MLX 在 macOS 上通过 Thunderbolt 实现的 RDMA(远程直接内存访问)现已作为独立库发布……
MLX 面向 macOS 的 RDMA-over-Thunderbolt 实现已独立成库,任何人都能用它组建高速 Mac 集群,在本地跑 AI 负载。
新型10 GbE USB适配器:更凉、更小、更便宜
对基于RTL8159芯片的新型、更小、更便宜的10 GbE USB适配器的评测,强调不同USB标准下的性能差异,并推荐使用USB 3.2 Gen 2x2端口以获得全速。
Framework 的10G以太网模块揭示了USB-C的复杂性
Jeff Geerling 测试了用于 Framework 计算机的 WisdPi 10G 以太网扩展卡,发现 USB-C 带宽复杂性和 Realtek RTL8159 控制器在许多笔记本电脑上限制了性能,尤其是在 Linux 系统下。
任务失败却成功:饱和NIC与磁盘带宽
作者深入探讨了如何使用RDMA和io_uring饱和NIC与磁盘带宽的技术细节,着重说明了一个AI代理如何以有缺陷的解释实现了优化,随后详细介绍了实际的调试过程。
在 2x3090 NVLINK 上对 Qwen 3.6 27B MTP 进行基准测试
对 Qwen 3.6 27B MTP 在 4 张 RTX 3090 GPU 上的基准分析表明,基于 NVLink 的张量并行相较于 PCIe 配置可实现显著的吞吐量提升(最高达 +53%)。