我通过一个提示在浏览器中构建了一个macOS克隆

Reddit r/artificial 模型

摘要

MiMo-V2.5-Pro 可以通过一个提示在浏览器中生成一个功能齐全的 macOS 桌面克隆,展示了在复杂代理任务上的强上下文保持能力。它在 MIT 许可下开源,并在 ClawEval 上领先于效率。

我给 MiMo-V2.5-Pro 一个提示,它就在浏览器中构建了一个完整的 macOS Sequoia 克隆。作为一个日常使用代理编码的人,这是我诚实的看法。提示很简单: *"一个像素完美的 macOS Sequoia 桌面克隆,完全在浏览器中构建。交互式窗口管理,54 个原生风格应用,带有物理缩放效果的 Dock,Spotlight,Launchpad,以及一个可用的 Safari 浏览器。"* 而它做到了。一个功能齐全的 macOS 用户界面在浏览器中运行,带有可用的 Dock、应用窗口、Spotlight 和 Launchpad,全部从一个提示渲染而成。你可以在上面的截图中看到结果。 **为什么这对代理工作流很重要:** 代理编码最困难的部分不是原始能力,而是在长而复杂的任务中保持上下文。MiMo-V2.5-Pro 在整个会话中保持了完整规格,没有偏离或丢失原始指令。这正是大多数模型在实际项目中失败的地方。 我通过 OpenCode 运行了这个。设置非常简单,因为模型暴露了兼容 OpenAI 的端点,所以它直接插入了我现有的技术栈。 **开源角度:** MIT 许可。你可以使用他们的 API 或自行托管。对于构建代理管道的团队来说,如果需要能干的模型且没有供应商锁定,这值得评估。在 ClawEval 上,它领先于开源领域,同时使用的 token 数量显著少于同类前沿模型。对于长时间的代理运行,这种效率会快速累积。 **结论:** 这不是玩具。如果你正在运行严肃的代理工作流,给它一个真正的测试。
查看原文

相似文章