amd-rocm

#amd-rocm

AMD Strix Halo 上的 Luce DFlash + PFlash：Qwen3.6-27B 解码速度提升 2.23 倍，预填充速度提升 3.05 倍（相较于 llama.cpp HIP）

Reddit r/LocalLLaMA ↗ · 2026-05-12

Luce 为 AMD Strix Halo APU 发布了 DFlash 和 PFlash 支持，在 Qwen3.6-27B 模型上，其解码和预填充速度相比 llama.cpp HIP 分别提升了 2.23 倍和 3.05 倍。

0 人收藏 0 人点赞

#amd-rocm

Hugging Face Blog ↗ · 2026-05-08 缓存

一个教程和项目，演示在AMD MI300X上使用ROCm对Qwen3-1.7B进行LoRA微调，用于临床问答，为医疗AI开发提供无需CUDA的替代方案。

0 人收藏 0 人点赞