cpu-optimization

#cpu-optimization

@venkat_systems: 推理不仅仅是GPU/加速器的问题。热路径中未经优化的CPU工作会极大影响性能。v0.…

X AI KOLs Timeline ↗ · 2026-06-19 缓存

Venkat 解释道，热路径中未经优化的CPU工作会严重影响推理性能，并介绍了他在 mooncake 中提交的PR，该PR添加了一个内存池，用于实现无锁、无分配的操作，使 vLLM 和 SGL 项目受益。

0 人收藏 0 人点赞

#cpu-optimization

Hacker News Top ↗ · 2026-05-24 缓存

一篇深入的技术博客文章，解释如何使用现代x86_64 CPU上的SIMD指令高效地转置矩阵，重点介绍类似_mm256_shuffle_epi8的AVX2内联函数。

0 人收藏 0 人点赞

#cpu-optimization

Reddit r/LocalLLaMA ↗ · 2026-04-21 缓存

该 PR 为 ggml-cpu 加入针对 x86 及通用 CPU 优化的 q1_0 点积内核，提升量化 LLM 推理速度。

0 人收藏 0 人点赞

#cpu-optimization

Lobsters Hottest ↗ · 2026-04-19

研究采用稀疏条带技术在CPU上优化2D图形渲染，以提升性能并降低内存开销。

0 人收藏 0 人点赞