mobile-ai

#mobile-ai

Gemma 12b 低于10瓦 6.5pp 1.3tg

Reddit r/LocalLLaMA ↗ · 2026-06-14

在Google Pixel 10 Pro上使用llama.cpp运行Gemma 12B模型，实现了每秒6.5个token的提示处理和每秒1.3个token的生成，功耗低于10瓦，展示了高效的设备端AI推理。

0 人收藏 0 人点赞

#mobile-ai

移动NPU上的能效型端侧RAG：Snapdragon X Elite系统设计与基准测试

arXiv cs.CL ↗ · 2026-06-11 缓存

本文介绍了首个完全运行在移动NPU（Snapdragon X Elite上的Qualcomm Hexagon）上的端到端RAG流水线，相比CPU实现了高达18倍的LLM预填充加速和4倍的能耗降低，且无质量退化。

0 人收藏 0 人点赞

#mobile-ai

本地iPhone AI图像生成正变得实用 - 每张图片仅需3秒

Reddit r/ArtificialInteligence ↗ · 2026-06-03

基准测试显示，在iPhone上本地运行Stable Diffusion 1.5，使用Realistic Vision V5.1 Hyper等优化模型，生成512x512图像最快仅需3.1秒，使得设备端AI图像生成变得切实可行。

0 人收藏 0 人点赞

#mobile-ai

无论准备与否，AI手机即将到来

Reddit r/artificial ↗ · 2026-06-01

本文讨论了AI智能手机即将到来及其对消费者和科技行业的影响。

0 人收藏 0 人点赞

#mobile-ai

Android上Gemini的问题不仅仅是隐私，而是行动边界。

Reddit r/AI_Agents ↗ · 2026-05-24

本文认为，将Gemini更深地整合进Android的真正问题不仅仅是隐私，而是行动边界——即AI可以读取、建议、起草、更改、发送、购买或删除什么——并提出了针对不同AI代理级别的分级许可模型。

0 人收藏 0 人点赞

#mobile-ai

Vibe coding 即将登陆你的手机

The Verge ↗ · 2026-05-20 缓存

谷歌和苹果正将 AI 驱动的 'vibe coding' 引入移动端，允许用户通过自然语言提示创建自定义 Android 应用、小组件和快捷方式，正如在 Google I/O 2026 上所展示，并据报道将在 iOS 上实现。

0 人收藏 0 人点赞

#mobile-ai

Google AI Edge Gallery v1.0.13 和 v1.0.14 更新：Gemma 4 多令牌预测、Pixel TPU 支持、实验性 MCP、新技能，以及聊天历史保存功能

Reddit r/LocalLLaMA ↗ · 2026-05-19 缓存

Google AI Edge Gallery v1.0.13 和 v1.0.14 更新增加了对 Gemma 4 的多令牌预测支持、Pixel TPU 优化、实验性 MCP、新技能以及聊天历史保存功能，提升了设备端生成式 AI 能力。

0 人收藏 0 人点赞

#mobile-ai

MiniCPM-V 4.6

Product Hunt ↗ · 2026-05-12

MiniCPM-V 4.6 是一款专为移动设备优化的极致高效 13 亿参数视觉语言模型。

0 人收藏 0 人点赞

#mobile-ai

@AdinaYakup: MiniCPM V4.6 一个真正能在手机上运行的 1B 多模态大语言模型，由 @OpenBMB 刚刚发布 1B - Apache2.0 支持 iOS、Android,…

X AI KOLs Following ↗ · 2026-05-11 缓存

OpenBMB 发布了 MiniCPM V4.6，这是一个专为移动设备优化的 1B 参数多模态大语言模型，采用 Apache 2.0 许可证。它具备混合视觉 token 压缩功能，声称在 iOS、Android 和 HarmonyOS 上原生运行时，吞吐量比 Qwen3.5 0.8B 快约 1.5 倍。

0 人收藏 0 人点赞

#mobile-ai

@billtheinvestor: 一部手机，干翻整个 3D 漫游行业！以前要花六位数才能做的浏览器交互式 3D 漫游，现在一夜之间就能完成 AI 扫描工具正在把普通手机变成全功能 3D 制作工作室

X AI KOLs Timeline ↗ · 2026-05-08 缓存

AI扫描工具正在将普通手机变成全功能3D制作工作室，原本需要六位数费用才能完成的浏览器交互式3D漫游，现在用手机即可快速实现。

0 人收藏 0 人点赞

#mobile-ai

@QingQ77: 让 AI 自动操控真实 Android 手机，执行社交、调研、内容运营等长时段移动端任务 https://github.com/Core-Mate/OpenGUI… OpenGUI 是个 AI 手机操控系统，AI 直接在你的 Androi…

X AI KOLs Timeline ↗ · 2026-05-08 缓存

OpenGUI 是一个开源 AI 手机操控系统，让 AI 自动操控真实 Android 设备执行社交、调研等长时段移动端任务，支持通过飞书、Telegram、Discord 或 REST API 远程派发任务，底层架构分为 Plan Supervisor 和 Executor Graph 两层，支持 Claude、Qwen、豆包等多种模型。

0 人收藏 0 人点赞

#mobile-ai

ClawGUI：用于训练、评估和部署 GUI Agent 的统一框架

Papers with Code Trending ↗ · 2026-04-13 缓存

ClawGUI 是一个开源框架，用于通过强化学习训练、评估和部署 GUI Agent，具备标准化基准测试能力，并支持跨平台部署至 Android、iOS 和 HarmonyOS。

0 人收藏 0 人点赞

#mobile-ai

推出 Gemma 3n 预览版：功能强大、高效、移动优先的 AI

Google DeepMind Blog ↗ · 2025-05-20 缓存

Google 推出 Gemma 3n 预览版，这是一个移动优先的开源 AI 模型，针对手机、平板电脑和笔记本电脑上的本地推理进行了优化。该模型采用与高通和联发科等硬件合作伙伴共同开发的新架构，利用分层嵌入等创新技术，在最少内存占用（2-3GB）的情况下实现快速性能，同时支持多模态功能。

0 人收藏 0 人点赞

#mobile-ai

Search What You See: The Tech Behind The Magic | Made by Google Podcast S9E4

YouTube AI Channels ↗ · 2026-05-08 缓存

Google 升级了 Circle to Search 功能，利用 Gemini 3 实现对屏幕内容的整体场景识别，特别是时尚造型的多物品分解与虚拟试穿。该更新允许用户无需截图即可直接寻找替代商品并查看上身效果，提升了视觉搜索的无缝体验。

0 人收藏 0 人点赞

mobile-ai

提交意见反馈