multi-socket

标签

Cards List
#multi-socket

我复刻了 ik_llama.cpp 并添加了 "--numa mirror" 模式,以最大化多路 CPU 系统的性能。分享并寻找测试者!

Reddit r/LocalLLaMA · 2026-06-21

一位开发者复刻了 ik_llama.cpp,添加了 '--numa mirror' 模式,该模式在 NUMA 节点间复制模型权重和 KV 缓存,以最大化多路 CPU 推理性能,并分享了基准测试结果,寻求测试者。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈