npu

标签

Cards List
#npu

AMD / Strix Halo+ 用户的大新闻

Reddit r/LocalLLaMA · 6天前

AMD Strix Halo 设备上的 NPU 现在可用于 AI 推理,支持混合模式,结合 NPU 和 iGPU 以实现更快的提示处理。Lemonade 和 AMD 的 ROCm 等软件使之成为可能。

0 人收藏 0 人点赞
#npu

Qualcomm NPU 编译器的逆向工程

Lobsters Hottest · 2026-06-20 缓存

逆向工程 Qualcomm NPU 编译器揭示了未文档化的 VTCM 内存管理、基于 MILP 的布局、自动精度更改,以及一个用于边缘部署优化的隐藏分析模拟器(Hextimate)。

0 人收藏 0 人点赞
#npu

@googlegemma: Gemma 4 E2B 在英特尔AI PC上运行速度超快,得益于OpenVINO上的LiteRT NPU支持!预填充性能提升1.3倍……

X AI KOLs Timeline · 2026-06-16 缓存

Gemma 4 E2B 在采用OpenVINO与LiteRT NPU支持的英特尔AI PC上,实现了预填充速度提升1.3倍、每瓦性能提升2.8倍,从而能够高效运行后台LLM任务。

0 人收藏 0 人点赞
#npu

xdna-top: 面向 Strix Halo (Ryzen AI Max) 的统一 NPU+iGPU 终端监视器 — 终于能看到 NPU 工作了

Reddit r/LocalLLaMA · 2026-06-11

xdna-top 是一款终端监视器,可在 Ryzen AI Max/Strix Halo 系统上同时显示 NPU 和 iGPU 活动,提供 NPU 计数器增量的真实视图,而非虚假的利用率百分比。

0 人收藏 0 人点赞
#npu

移动NPU上的能效型端侧RAG:Snapdragon X Elite系统设计与基准测试

arXiv cs.CL · 2026-06-11 缓存

本文介绍了首个完全运行在移动NPU(Snapdragon X Elite上的Qualcomm Hexagon)上的端到端RAG流水线,相比CPU实现了高达18倍的LLM预填充加速和4倍的能耗降低,且无质量退化。

0 人收藏 0 人点赞
#npu

Sipeed的K3 RISC-V单板计算机可运行30B参数大语言模型,提供60 TOPS(INT4)性能,支持BF16/FP16/INT4

Reddit r/LocalLLaMA · 2026-05-13

Sipeed新款K3 RISC-V单板计算机配备32GB LPDDR5内存和60 TOPS的NPU,可本地推理大语言模型,速度高达每秒15个token。

0 人收藏 0 人点赞
#npu

在Ryzen AI 7 350 NPU上达到峰值TOPS性能

Lobsters Hottest · 2026-05-08 缓存

关于在AMD Ryzen AI 7 350 NPU上实现峰值TOPS性能的技术深度剖析,与Xilinx AIE-ML v2 AI引擎进行比较,并解释用于矩阵乘法工作负载的硬件架构。

0 人收藏 0 人点赞
#npu

@agupta:有些想法在用编码智能体做出概念验证后会清晰得多,例如我直到看了这篇附代码的文章才真正明白 GPU 与 NPU 在设备上如何竞争内存……

X AI KOLs Following · 2026-04-20 缓存

一条推文指出,编码智能体能帮助阐明复杂概念,并以 GPU 与 NPU 在设备上的内存竞争为例,通过代码进行了演示。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈