edge-ai

标签

Cards List
#edge-ai

YOLO26 简介

Hacker News Top · 昨天 缓存

YOLO26 是一个于2026年1月发布的多任务计算机视觉模型系列,具备无需 Non-Maximum Suppression 的端到端检测功能以降低延迟,并针对边缘部署进行了优化,具有改进的CPU推理能力和紧凑设计。

0 人收藏 0 人点赞
#edge-ai

@Oluwaphilemon1: Claude Fable 5 已死,GPT-5.6 推迟发布…微软改变了游戏规则,他们开源了bitnet.cpp,一个1…

X AI KOLs Timeline · 昨天 缓存

微软开源了bitnet.cpp,这是一个1位LLM推理框架,可以在没有GPU的本地CPU上运行100B参数模型,实现6.17倍的更快推理和82.2%的能耗降低。

0 人收藏 0 人点赞
#edge-ai

Qualcomm NPU 编译器的逆向工程

Lobsters Hottest · 4天前 缓存

逆向工程 Qualcomm NPU 编译器揭示了未文档化的 VTCM 内存管理、基于 MILP 的布局、自动精度更改,以及一个用于边缘部署优化的隐藏分析模拟器(Hextimate)。

0 人收藏 0 人点赞
#edge-ai

@ciruai:在配备128GB内存的AMD Ryzen AI Max+ 395 Strix Halo上测试DeepSeek v4 Flash。在中等长度上下文中获得约15 TPS……

X AI KOLs Timeline · 6天前 缓存

在配备128GB内存的AMD Ryzen AI Max+ 395上测试DeepSeek v4 Flash,本地运行284B MoE模型(13B活跃参数)可达约15 TPS。成本仅需3000美元,而数据中心配置需25000美元以上,凸显了在消费级硬件上运行大型模型的可行性。

0 人收藏 0 人点赞
#edge-ai

Le Gros Chaton 在我的'84 Corolla收音机上运行

Reddit r/LocalLLaMA · 2026-06-16

演示在1984年丰田Corolla收音机上运行Le Gros Chaton(可能是一个轻量级AI模型),展示在复古硬件上的边缘AI应用。

0 人收藏 0 人点赞
#edge-ai

@cevenif: 市面上90%的机器学习教程其实都在误导你——光会训练模型又能怎样?上不了生产线,前面全白搭。 说真的,这个坑我见过太多人往里跳了:跟着教程把模型训得飞起,一扔进真实环境就当场歇菜——不知道怎么部署、不会做监控、扩展性一塌糊涂。 哈佛大学直…

X AI KOLs Timeline · 2026-06-16 缓存

哈佛大学开源《Machine Learning Systems》教材,系统讲解ML系统设计、数据工程、模型部署、MLOps和边缘AI等实践内容,旨在帮助将AI从研究落地到生产环境,免费获取于GitHub。

0 人收藏 0 人点赞
#edge-ai

APEX: Adaptive Principle EXtraction — 面向生产级AI智能体的三层自进化框架

arXiv cs.AI · 2026-06-16 缓存

APEX 提出了一个面向生产级AI智能体的三层自进化框架,同时优化了控制层(harness)、行为原则和工作流拓扑。在生产级智能体上的实验显示,健康评分和工作流质量显著提升,且仅需极少的LLM调用。

0 人收藏 0 人点赞
#edge-ai

一颗卫星刚刚学会了自主寻找目标——这意味着什么

TechCrunch AI · 2026-06-15 缓存

一颗名为 Yam-9 的卫星在轨使用了 Google DeepMind 的 Gemma 3 视觉语言模型,基于自然语言查询自主识别感兴趣区域,标志着首次有报道在太空中使用 VLM,并预示着卫星运行向更加自主的方向转变。

0 人收藏 0 人点赞
#edge-ai

PrintGuard 2.0 — ShuffleNetV2 + 少样本原型网络,通过 LiteRT 的 TFLite,约 5 MB,可在浏览器(Pyodide)和 CPython 上无需修改直接运行 [P]

Reddit r/MachineLearning · 2026-06-15

PrintGuard 2.0 是对基于 ShuffleNetV2 骨干网络和原型网络的少样本 FDM 故障检测器的重大重写,现在通过平台抽象层实现了单一 Python 引擎,可在 CPython 和浏览器中的 Pyodide 上无需修改运行,支持每台打印机的灵敏度调整和公平推理调度。

0 人收藏 0 人点赞
#edge-ai

D2H-AD:一种利用超维计算的高级异常检测混合模型

arXiv cs.LG · 2026-06-15 缓存

D2H-AD是一种新颖的异常检测框架,采用超维计算(HDC),结合了基于距离和密度感知的编码。它在多个基准测试中优于五种基线方法,为边缘AI和物联网提供轻量级、可解释且高效的性能。

0 人收藏 0 人点赞
#edge-ai

🚀PP-OCRv6 正式发布!

Reddit r/LocalLLaMA · 2026-06-12

PaddleOCR 发布 PP-OCRv6,全新的 OCR 模型系列,参数量从 1.5M 到 34.5M,提供更高的精度和更快的推理速度,支持 50 种语言以及 PCB、CAD 图纸等新场景,采用 Apache 2.0 开源许可证。

0 人收藏 0 人点赞
#edge-ai

Sigma-Branch: 面向动态推理的分层单路径网络重构,减少活跃参数

arXiv cs.LG · 2026-06-10 缓存

Sigma-Branch 将预训练的稠密网络重构成一个层次化二叉树结构,包含共享主干、路由器和专用叶子节点。在 CIFAR-100、ImageNet-1K 和 ModelNet40 上,每次推理的活跃参数减少 58-60%,同时精度下降不超过基线精确率的 1.72 个百分点。

0 人收藏 0 人点赞
#edge-ai

@danveloper: https://x.com/danveloper/status/2064387956387758206

X AI KOLs Timeline · 2026-06-09 缓存

一位开发者通过在NVMe SSD上流式传输模型权重,在树莓派5上运行了DeepSeek-V4-Flash,达到了1.3 tokens/秒的速率,功耗仅8瓦,证明了前沿级别的开放权重模型在低成本、离线硬件上的可行性。

0 人收藏 0 人点赞
#edge-ai

为 Hermes Agent 构建的 Jetson Orin NX 系统及基准测试

Reddit r/LocalLLaMA · 2026-06-09

详细介绍了为运行 Hermes Agent 而构建的 Jetson Orin NX 系统及基准测试,使用 Gemma 4 26B 量化模型,在 8K 上下文中达到 14.65 tok/s,在 60K 上下文中达到 10.21 tok/s。

0 人收藏 0 人点赞
#edge-ai

从人工引导到自主:面向空间NPU的端到端LLM部署的智能体技能系统

arXiv cs.LG · 2026-06-09 缓存

本文提出了一种两阶段方法论,用于在空间NPU上进行端到端大语言模型(LLM)部署,从人工引导开发逐步过渡到自主智能体技能系统。该系统在参考模型上实现了预填充阶段2.2倍、解码阶段4.0倍的加速,并以极少的人工引导在AMD XDNA 2 NPU上自主部署了另外八个LLM。

0 人收藏 0 人点赞
#edge-ai

无GPU革命:高效AI模型如何让人工智能大众化

Reddit r/AI_Agents · 2026-06-08

一场静默的革命正在让强大的AI模型无需昂贵GPU即可在消费级硬件上运行,这得益于量化技术和优化实现(如llama.cpp的Gemma4 MTP支持)的突破,为爱好者、小型企业和边缘计算打开了大门。

0 人收藏 0 人点赞
#edge-ai

集群三台Jetson Nano Orin Super

Reddit r/LocalLLaMA · 2026-06-07

作者宣布了一篇新的博客文章,内容是关于将三台Jetson Nano Orin Super组成集群,用于分布式训练和推理,延续了一个系列,旨在帮助人们使用易于获取的硬件构建小型计算集群。

0 人收藏 0 人点赞
#edge-ai

我们是否低估了小型边缘AI模型?[D]

Reddit r/MachineLearning · 2026-06-05

一位开发者认为,边缘AI社区忽视了那些可以在智能手机等设备上本地运行的小型专门模型,并以自建的离线摩尔斯电码识别功能为例。该项目使用了小于5MB的AI模型,基于TensorFlow/Keras和LiteRT,从数据生成到移动端集成的整个流程均为自建。

0 人收藏 0 人点赞
#edge-ai

@KanikaBK: Google刚刚投下了一颗AI重磅炸弹!一场十亿美元的游戏开始了。Gemma 4 12B在你的笔记本电脑上运行。16GB内存,那就是……

X AI KOLs Timeline · 2026-06-03 缓存

Google发布了Gemma 4 12B,这是一个采用Apache 2.0许可证的开源多模态AI模型,可在拥有16GB内存的笔记本电脑上本地运行,面向企业边缘部署。

0 人收藏 0 人点赞
#edge-ai

@zhixianio: 这两天新机器到了之后,我开始了「苦行僧」式的强迫自己使用本地模型来完成常见任务的修行 本以为会非常痛苦,没想到无论是速度还是质量都大大超出我的预期: 模型: Qwen3.6-35B-A3B-oQ6-fp16-mtp 运行:oMLX,开 N…

X AI KOLs Timeline · 2026-06-03 缓存

作者在本地新机器上使用Qwen3.6-35B-A3B模型和oMLX工具进行日常任务,发现速度和效果远超预期,甚至在PA和Coding场景下优于远程LLM,体现了端侧AI能力的显著提升。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈