React Native ExecuTorch 现已支持 Gemma 4（Vulkan 和 MLX 加速）

Reddit r/LocalLLaMA 2026/06/15 12:41 工具

react-native executorch gemma offline-inference gpu-acceleration vulkan mlx

摘要

react-native-executorch 库现已集成 Google 的 Gemma 4 模型，可实现完全离线的 GPU 加速推理，在 Android 上使用 Vulkan 委托，在 Apple Silicon 上使用 MLX 委托。

我们已将 Gemma 4 集成到 **react-native-executorch** 中。现在你可以完全离线地在 React Native 应用中运行它，通过 Android 上的 Vulkan 委托和 Apple Silicon 上的 MLX 委托实现 GPU 加速。附带的演示应用链接请点击[此处](https://github.com/software-mansion/react-native-executorch/tree/main/apps/llm)。

查看原文

React Native ExecuTorch 现已支持 Gemma 4（Vulkan 和 MLX 加速）

相似文章

从 RTX 到 Spark：NVIDIA 加速 Gemma 4 赋能本地智能体 AI

@rohanpaul_ai：Gemma 4（特别是其面向边缘优化的 E2B 与 E4B 量化版）通过 Locally 等应用，在 iPhone 上实现完全离线运行……

@PyTorch：ExecuTorch 现有一个 MLX 委托，可在 Apple Silicon GPU 上运行 PyTorch 模型。它支持大语言模型、语音转文字、以及……

Gemma 4 + LiteRT-LM在移动设备上：内存和性能远优于我的llama.cpp设置

在MLX中使用turboquant（及自定义内核）运行Gemma4 26b MoE

提交意见反馈