offline-inference

标签

Cards List
#offline-inference

@danveloper: https://x.com/danveloper/status/2064387956387758206

X AI KOLs Timeline · 4天前 缓存

一位开发者通过在NVMe SSD上流式传输模型权重,在树莓派5上运行了DeepSeek-V4-Flash,达到了1.3 tokens/秒的速率,功耗仅8瓦,证明了前沿级别的开放权重模型在低成本、离线硬件上的可行性。

0 人收藏 0 人点赞
#offline-inference

使用 Transformers.js 在 WebGPU 上完全离线运行 Gemma 4,并通过 WebSerial 控制 Reachy Mini

Reddit r/LocalLLaMA · 2026-05-11

演示了如何使用 WebGPU 和 Transformers.js 在浏览器中离线运行 Gemma 4,并通过 WebSerial 控制 Reachy Mini 机器人。

0 人收藏 0 人点赞
#offline-inference

是什么阻碍了 App 把用户设备当成服务器、本地跑 LLM?

Reddit r/singularity · 2026-04-22

一位用户思考为何更多 App 不在手机上直接跑本地 LLM,指出 Gemma 2-4B 模型已能离线运行,在接近 GPT-4o 质量的同时还能省掉服务器成本。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈