标签
该 PR 为 ggml-cpu 加入针对 x86 及通用 CPU 优化的 q1_0 点积内核,提升量化 LLM 推理速度。
研究采用稀疏条带技术在CPU上优化2D图形渲染,以提升性能并降低内存开销。