@TeksEdge: 已解决!Qwen3.6-27B-FP8 现已在 Intel Arc Pro B70 上运行!LocalMaxxing 展示了 4× Arc Pro B70 32GB 的有效运行,速度约 5…

X AI KOLs Following 新闻

摘要

Qwen3.6-27B-FP8 模型现已在 Intel Arc Pro B70 GPU 上运行,速度约 50 tok/s,并修复了 vLLM 的一个 bug,这标志着 Intel GPU 本地 AI 推理的一个重要里程碑。

已解决!Qwen3.6-27B-FP8 现已在 Intel Arc Pro B70 上运行! LocalMaxxing 展示了 4× Arc Pro B70 32GB 的有效运行,速度约 50 tok/s,由 @xyster 解决 这对 Intel GPU 本地 AI 来说可是大事 27B 级 FP8 推理不再只是“未来也许有合适的补丁才能实现” 现在它已经 基准测试 正在运行 真实可用 在 Intel Arc Pro B70 上 软件栈仍在早期阶段,但这正是 Arc Pro B70 所需的那种证明点
查看原文
查看缓存全文

缓存时间: 2026/05/16 07:15

解决!Qwen3.6-27B-FP8 现已成功运行于 Intel Arc Pro B70!

LocalMaxxing 展示了 4× Arc Pro B70 32GB 的实际运行效果,速度约 50 tok/s —— 由 @xyster 解决

这对 Intel GPU 本地 AI 来说意义重大

27B 级别 FP8 推理不再只是“也许将来打了补丁就能行”

现在它已经 经过基准测试 实际运行 真实可用 运行在 Intel Arc Pro B70 上

软件栈虽然还处于早期阶段,但这正是 Arc Pro B70 需要的实证

David Hendrickson (@TeksEdge): 🪲 Intel Pro ARC B70 现已推出针对 Qwen3.5-27B 的新 vLLM 错误修复。有人测试过吗?

✅ 两天前提交的新错误修复(commit b3169b8): → 修复了 Qwen3.5-27B 在 TP=1(H=16, HV=48)时 gdn_conv_fused_seq 崩溃的问题 ⚠️ 对于更高 TP(如 TP=4)仍未确认有重大修复

相似文章