exllamav3

标签

Cards List
#exllamav3

我移植了EXL3使其在Apple Silicon上良好运行 - PonyExl3

Reddit r/LocalLLaMA · 2026-06-15

将EXL3 LLM编解码器移植到Apple Silicon上通过Metal运行,在M5 Max上实现了高预填充和生成速度(例如,~600 tok/s预填充,不同模型下17-80 tok/s生成)。

0 人收藏 0 人点赞
#exllamav3

@0xSero:关于 LLM 推理与部署,看这一篇就够了。你听说过:- vLLM - SGLang - llama.cpp - …

X AI KOLs Timeline · 2026-04-20 缓存

vLLM、SGLang、llama.cpp 与 ExLlamaV3 等主流开源推理引擎概览,助你轻松托管并运行大模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈