我开发了一款 iOS 应用，可以在你的 iPhone/iPad 上对 GGUF 模型进行基准测试

Reddit r/LocalLLaMA 2026/06/05 16:27 工具

ios app gguf benchmarking llama-cpp metal offline-chat

摘要

GenBench 是一款免费的 iOS 应用，允许用户使用 llama.cpp 和 Metal 在 iPhone/iPad 上下载、运行和基准测试 GGUF 模型，支持离线聊天、标准化基准测试和全球排行榜等功能。

嘿，我一直在开发 **GenBench**，一款免费的 iOS 应用，让你可以直接在 iPhone 或 iPad 上使用 llama.cpp + Metal 下载、运行和基准测试 GGUF 模型。 **它能做什么：** - 轻点一下即可从 Hugging Face 搜索和下载 GGUF 模型 - 完全离线与模型聊天 - 使用标准化提示进行基准测试——测量 tok/s、首 token 延迟和峰值内存 - 将分数提交到全球排行榜，跨设备比较 - 支持文本和视觉模型（MiniCPM-V 等） **我为什么开发它：** 我一直看到有人问“X 模型在 iPhone 上运行有多快？”却无法轻松测试。现有工具要么仅限 CLI，要么仅限 macOS。我想要一个只需点击下载 → 运行就能得到真实数据的工具。 https://preview.redd.it/akuoevg9qh5h1.png?width=1206&format=png&auto=webp&s=1afc35f0add883eff571a0f53ae3b0eacc9e2712 **我看到的一些结果：** - SmolLM2 1.7B Q4_K_M 在 iPhone 16 Pro 上：约 35 tok/s - Qwen2.5 3B Q4_K_M 在 iPhone 15 Pro 上：约 20 tok/s - Phi-3.5 Mini Q4_K_M 在 iPad Pro M4 上：约 45 tok/s （你的数字会有所不同——这正是这款应用的意义所在） **App Store 链接：** [https://apps.apple.com/us/app/genbench/id6775272272](https://apps.apple.com/us/app/genbench/id6775272272) **网站：** [https://genbench.tken.ai](https://genbench.tken.ai/) 完全免费，无需账户，无广告。排行榜提交是匿名的。很希望得到这个社区的反馈——我应该把哪些模型添加到推荐列表？你希望看到哪些基准测试指标？正考虑下一步添加困惑度测量。

查看原文

我开发了一款 iOS 应用，可以在你的 iPhone/iPad 上对 GGUF 模型进行基准测试

相似文章

我开发了一款在本地运行AI模型的安卓应用

@yoheinakajima：刚在我的手机（17 Pro）上运行了这个

MobileGym: 一个可验证且高度并行的移动GUI代理研究仿真平台

在你的iPhone上运行（最大的）本地模型

在 Anubis OSS 的 UI 中新增了直接下载模型的功能——如果有人愿意帮忙测试，那就太好了

提交意见反馈