cpu-optimization

标签

Cards List
#cpu-optimization

@venkat_systems: 推理不仅仅是GPU/加速器的问题。热路径中未经优化的CPU工作会极大影响性能。v0.…

X AI KOLs Timeline · 2026-06-19 缓存

Venkat 解释道,热路径中未经优化的CPU工作会严重影响推理性能,并介绍了他在 mooncake 中提交的PR,该PR添加了一个内存池,用于实现无锁、无分配的操作,使 vLLM 和 SGL 项目受益。

0 人收藏 0 人点赞
#cpu-optimization

矩阵转置的实现要点

Hacker News Top · 2026-05-24 缓存

一篇深入的技术博客文章,解释如何使用现代x86_64 CPU上的SIMD指令高效地转置矩阵,重点介绍类似_mm256_shuffle_epi8的AVX2内联函数。

0 人收藏 0 人点赞
#cpu-optimization

ggml-cpu:pl752 提交的 x86 与通用 CPU q1_0 点积优化(后续)· Pull Request #21636 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 2026-04-21 缓存

该 PR 为 ggml-cpu 加入针对 x86 及通用 CPU 优化的 q1_0 点积内核,提升量化 LLM 推理速度。

0 人收藏 0 人点赞
#cpu-optimization

使用稀疏条带在CPU上进行高性能2D图形渲染

Lobsters Hottest · 2026-04-19

研究采用稀疏条带技术在CPU上优化2D图形渲染,以提升性能并降低内存开销。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈