on-device-inference

标签

Cards List
#on-device-inference

昨天在我的3090上跑了gemma 4 12b,我觉得本地模型领域已经变了

Reddit r/artificial · 3天前

一位用户报告称,通过GGUF量化在单张RTX 3090上本地运行了谷歌的Gemma 4 12B模型,发现其性能强劲,包括真实的256k上下文、多模态能力以及函数调用功能,在编码任务上甚至优于更大的70B模型。

0 人收藏 0 人点赞
#on-device-inference

当云代理遇上设备代理:混合多智能体系统的经验教训

Hugging Face Daily Papers · 2026-05-28 缓存

本文系统研究了结合云端LLM与端侧SLM的混合多智能体系统,揭示了任务依赖的最优架构,并挑战了“更多前沿算力总是能提升性能”的假设。

0 人收藏 0 人点赞
#on-device-inference

MobileExplorer: 通过在线探索加速移动GUI智能体的设备端推理

arXiv cs.AI · 2026-05-27 缓存

MobileExplorer是一个新框架,通过在模型推理期间对UI元素进行轻量级并行探索,加速移动GUI智能体的设备端推理,将推理步骤和延迟降低23%,同时保持或提高任务成功率。

0 人收藏 0 人点赞
#on-device-inference

ExecuTorch —— 统一在终端设备运行 AI 模型的 PyTorch 方案

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 ExecuTorch,这是一个原生的 PyTorch 部署框架,旨在无需模型转换或重新实现,即可在多样化的边缘设备上运行 AI 模型。

0 人收藏 0 人点赞
#on-device-inference

本地 AI 应成为常态

Hacker News Top · 2026-05-10 缓存

本文指出,出于隐私和可靠性方面的顾虑,不应依赖云端托管的 AI API,并倡导采用设备端 AI 处理模式,文中以一款利用 Apple 本地模型 API 的原生 iOS 应用为例进行了说明。

0 人收藏 0 人点赞
#on-device-inference

你认为边缘AI在自主系统、机器人技术还是本地私有推理中更具意义?

Reddit r/artificial · 2026-05-08

一篇探讨边缘AI在何处产生最大影响的讨论帖:自主系统与机器人技术、低功耗视觉系统、私有本地LLM,或带宽受限的工业部署。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈