lite-rt-lm

#lite-rt-lm

Gemma 4 + LiteRT-LM在移动设备上：内存和性能远优于我的llama.cpp设置

Reddit r/LocalLLaMA ↗ · 13小时前

用户分享在移动设备上运行Gemma 4与LiteRT-LM的亲身对比体验，相较于之前的llama.cpp设置，内存占用显著降低（1.5-2 GB vs 4-5 GB），推理速度更快（2-4秒 vs 7-10秒），测试机型包括三星S25 Ultra和iPhone 13 Pro Max。

0 人收藏 0 人点赞