exllamav3

#exllamav3

我移植了EXL3使其在Apple Silicon上良好运行 - PonyExl3

Reddit r/LocalLLaMA ↗ · 2026-06-15

将EXL3 LLM编解码器移植到Apple Silicon上通过Metal运行，在M5 Max上实现了高预填充和生成速度（例如，~600 tok/s预填充，不同模型下17-80 tok/s生成）。

0 人收藏 0 人点赞

#exllamav3

X AI KOLs Timeline ↗ · 2026-04-20 缓存

vLLM、SGLang、llama.cpp 与 ExLlamaV3 等主流开源推理引擎概览，助你轻松托管并运行大模型。

0 人收藏 0 人点赞