@stevibe: 我进一步探索了本地模型的另一种可能性:将 Qwen3.6 35B A3B 与 NVIDIA LocateAnything-3B 结合,作为一个本地计算机使用代理…
摘要
演示了一个本地计算机使用代理,结合了 Qwen3.6 35B A3B 和 NVIDIA LocateAnything-3B 模型,通过截图执行切换 Mac 显示模式等任务,无需无障碍 API,完全在本地硬件上运行。
查看缓存全文
缓存时间: 2026/06/04 04:00
我进一步探索了本地模型的可能性:Qwen3.6 35B A3B + NVIDIA LocateAnything-3B,作为本地计算机使用智能体(概念验证)。
在演示中,我要求它把 Mac 切换到浅色模式,它完成了。再切换回深色模式,它也做到了——找到系统设置中的正确开关、点击它,并自行验证更改。
整个过程完全基于截图,因此无需 Accessibility API。只要内容出现在屏幕上,智能体就能看到并操作。这一切完全运行在你的自有硬件上——私密、本地,由两个小规模开放模型构建而成。
相似文章
@stevibe: Qwen3.6 35B A3B 自己无法填写纸质表格,但配上 NVIDIA 的 LocateAnything-3B——HuggingFace 上排名第一的热门模型……
演示显示,Qwen3.6 35B A3B 结合 NVIDIA 的 LocateAnything-3B 作为视觉工具,能够通过检测字段位置准确填写纸质表格,证明小型模型可以通过协作完成单个大模型无法胜任的任务。
@davis7:@0xSero 帮我把本地模型配置好了,我没想到它们现在竟然这么强大了。这算是前沿(frontier)级别了吗……
作者强调了在 RTX 5090 上本地运行开源 Qwen 3.6-27B 模型的卓越能力,指出其在编程任务上的强劲表现,并与商业模型进行了对比,尽管本地部署过程颇具挑战性。
本地运行 Qwen3.6-35B-A3B 作为编码 Agent:我的完整部署与可用配置
一份详尽指南,教你如何在 Apple Silicon 上通过 llama.cpp 本地运行 350 亿参数 Qwen3.6 模型,并驱动 pi 编码 Agent,附带优化后的启动参数与采样配置。
“Browser OS”由Qwen 3.6 35B实现:这是我从本地模型获得的最佳结果
一位用户报告称,通过Qwen 3.6 35B在本地运行'Browser OS'实现,取得了令人印象深刻的结果,凸显了该模型在不依赖云端的情况下执行复杂任务的能力。
本地模型优化(3 分钟阅读)
本文分析了在 MacBook Pro 上本地运行 AI 推理的可行性,对比了本地 Qwen 35B 模型与云端 Claude Opus 4.5。结论是,对于常规任务,本地模型速度快 2 倍,尽管在能力上略有差距,但仍是日常工作量中一半任务的实用选择。