on-device

#on-device

Meta为其智能眼镜添加荒谬的“速率限制”和软付费墙

The Verge ↗ · 10小时前缓存

Meta为其智能眼镜上的设备端对话焦点功能引入了争议性的速率限制和每月19.99美元的订阅费，而该功能此前无需联网或服务器成本即可使用。

0 人收藏 0 人点赞

#on-device

@tbpn: 完整采访：工程师 Edward Coristine (@as400495) 和 Tai Groot (@taigrr) 刚刚发布了一个名为 Rampart 的 ML 模型……

X AI KOLs Following ↗ · 昨天缓存

工程师 Edward Coristine 和 Tai Groot 发布了 Rampart，这是一个开源 AI 隐私模型，用于设备端 PII（个人身份信息）编辑，完全在浏览器中运行，由 National Design Studio 开发。

0 人收藏 0 人点赞

#on-device

@MaziyarPanahi: 一年前，OpenMed还不存在。如今：3.4亿次模型下载。1500+个开放医学模型，全部采用Apache 2.0许可。650+个可在……

X AI KOLs Following ↗ · 昨天缓存

成立一年后，OpenMed已实现3.4亿次模型下载，提供超过1500个采用Apache 2.0许可的开放医学模型，其中650+个能够在iPhone上本地运行。

0 人收藏 0 人点赞

#on-device

让一个4B本地模型真正发挥作用：设备端“记忆助手”背后的distill-on-idle流水线

Reddit r/LocalLLaMA ↗ · 4天前

描述了一种'distill-on-idle'流水线，它使得一个4B参数的本地模型能够作为设备端记忆助手有效运行，展示了小型模型的实际应用。

0 人收藏 0 人点赞

#on-device

AnySimLite: 一种轻量级少样本相似度编码器用于设备端语音相关分类

arXiv cs.CL ↗ · 5天前缓存

介绍 AnySimLite，一种用于设备端语音相关分类任务的轻量级相似度编码器，在模型大小不到 qLLaMA-LoRA-7B 基线的 1/250 的情况下，实现了最先进或具有竞争力的性能。

0 人收藏 0 人点赞

#on-device

Liquid AI 发布 Liquid Foundation Models 2.5 230M（3分钟阅读）

TLDR AI ↗ · 5天前缓存

Liquid AI 发布 LFM2.5-230M，这是一款轻量级基础模型，可在从云端 GPU 到 CPU 乃至 Raspberry Pi 的设备上运行，在工具使用和数据提取任务上表现出色。

0 人收藏 0 人点赞

#on-device

@TheAhmadOsman：持续学习将在本地运行，这就是为什么大型实验室不谈论它。不是你的权重，不是你的模型，实际上……

X AI KOLs Following ↗ · 5天前缓存

一条推文主张持续学习将在本地运行，并解释了为什么主要AI实验室避免讨论它：因为数据保留在设备上。

0 人收藏 0 人点赞

#on-device

@yoheinakajima：谁想帮Eyal在这个方法上挑毛病——在浏览器中运行LLM推理？

X AI KOLs Following ↗ · 5天前缓存

Eyal Toledano 使用纯 WebGPU/WGSL 构建了一个LLM推理引擎，可在浏览器和Node中无API密钥地本地运行，并正寻求同行评审。

0 人收藏 0 人点赞

#on-device

@timseyde: 小飞象的第一步 — LFM2.5-230M 使用 @nvidia SONIC 提供的预训练技能执行多步工具调用。同样的…

X AI KOLs Following ↗ · 5天前缓存

Liquid AI 的 LFM2.5-230M 模型在 Unitree G1 机器人上展示了多步工具调用能力，完全在 NVIDIA Jetson Orin 设备端运行，充当技能选择层。

0 人收藏 0 人点赞

#on-device

@liquidai：推出LFM2.5-230M：这是我们最小的模型，专为快速运行而设计，可在任何地方（CPU、NPU和GPU）上运行，以实现代理型任务…

X AI KOLs Timeline ↗ · 5天前缓存

Liquid AI发布了LFM2.5-230M，这是一个拥有230M参数的小型模型，针对CPU、NPU和GPU上的快速推理进行了优化，适用于手机和机器人等设备上的代理型任务。

0 人收藏 0 人点赞

#on-device

设备端神经架构搜索

arXiv cs.LG ↗ · 6天前缓存

提出了一种轻量级神经架构搜索方法，直接在部署设备上执行，用于近传感器计算。在sEMG手语和故障诊断数据集上进行了验证，提高了准确率并减少了RAM占用。

0 人收藏 0 人点赞

#on-device

LiquidAI/LFM2.5-230M

Hugging Face Models Trending ↗ · 6天前缓存

Liquid AI发布了LFM2.5-230M，一款紧凑的230M参数混合模型，针对设备端部署进行了优化，边缘推理速度快（在Galaxy S25 Ultra上达到213 tok/s），并通过强化学习构建，适用于智能体任务。

0 人收藏 0 人点赞

#on-device

用于设备端故障检测的轻量级Transformer模型：资源受限部署的基准研究

arXiv cs.LG ↗ · 2026-06-24 缓存

一项基准研究，在三个公开数据集上对比了传统机器学习方法（随机森林、XGBoost、SVM、逻辑回归）与轻量级Transformer变体（DistilBERT、TinyBERT、MobileBERT）在设备端故障检测中的表现。传统机器学习在远小得多的资源占用下实现了有竞争力的准确率，而TinyBERT-4L是最便于部署的Transformer模型。

0 人收藏 0 人点赞

#on-device