Qwen-AgentWorld-35B-A3B:一个3B激活参数的MoE模型,用于模拟MCP、终端、软件工程、安卓、网页和操作系统环境

Reddit r/LocalLLaMA 模型

摘要

Qwen发布了Qwen-AgentWorld-35B-A3B,这是一个35B参数的MoE模型,拥有3B激活参数,旨在作为语言世界模型,模拟智能体在七个领域(包括MCP、终端、软件工程、安卓、网页和操作系统)交互时的环境响应。

Qwen刚刚发布了Qwen-AgentWorld-35B-A3B —— 一个35B参数的MoE模型,每个token仅激活约3B参数。有趣的是:它并不是作为标准的聊天/指令模型或完全自主的智能体来定位的。它是一个语言世界模型,经过训练用于预测智能体执行动作后环境会返回什么。它覆盖了七个智能体交互领域:MCP / 工具调用、搜索、终端、软件工程、安卓、网页、操作系统图形用户界面交互。其预期用途似乎是模拟智能体循环中的环境端:给定动作历史和一个新的工具/GUI动作,预测下一个观察/状态。这对于智能体训练、离线评估、合成轨迹、测试工具使用工作流或构建沙盒式环境(无需持续运行真实工具)可能很有用。Hugging Face 链接
查看原文

相似文章

Qwen/Qwen-AgentWorld-35B-A3B

Hugging Face Models Trending

Qwen 发布 Qwen-AgentWorld-35B-A3B,这是一个原生语言世界模型,能够通过长链思维推理模拟七个领域的智能体环境。该模型采用三阶段流水线训练,支持 MCP、搜索、终端、SWE、Android、Web 和操作系统交互。

Qwen-AgentWorld-397B-A17B

Reddit r/LocalLLaMA

Qwen 发布了新的大语言模型 Qwen-AgentWorld-397B-A17B,详情请见 HuggingFace 和 Qwen 博客。

Qwen/Qwen3.6-35B-A3B

Hugging Face Models Trending

Qwen 发布 Qwen3.6-35B-A3B,一款开源权重的混合专家(MoE)模型,总参数量 35B,激活参数量 3B,在智能体编码和推理能力保持方面实现显著提升。