Qwen-AgentWorld-35B-A3B:一个3B激活参数的MoE模型,用于模拟MCP、终端、软件工程、安卓、网页和操作系统环境
摘要
Qwen发布了Qwen-AgentWorld-35B-A3B,这是一个35B参数的MoE模型,拥有3B激活参数,旨在作为语言世界模型,模拟智能体在七个领域(包括MCP、终端、软件工程、安卓、网页和操作系统)交互时的环境响应。
Qwen刚刚发布了Qwen-AgentWorld-35B-A3B —— 一个35B参数的MoE模型,每个token仅激活约3B参数。有趣的是:它并不是作为标准的聊天/指令模型或完全自主的智能体来定位的。它是一个语言世界模型,经过训练用于预测智能体执行动作后环境会返回什么。它覆盖了七个智能体交互领域:MCP / 工具调用、搜索、终端、软件工程、安卓、网页、操作系统图形用户界面交互。其预期用途似乎是模拟智能体循环中的环境端:给定动作历史和一个新的工具/GUI动作,预测下一个观察/状态。这对于智能体训练、离线评估、合成轨迹、测试工具使用工作流或构建沙盒式环境(无需持续运行真实工具)可能很有用。Hugging Face 链接
相似文章
Qwen/Qwen-AgentWorld-35B-A3B
Qwen 发布 Qwen-AgentWorld-35B-A3B,这是一个原生语言世界模型,能够通过长链思维推理模拟七个领域的智能体环境。该模型采用三阶段流水线训练,支持 MCP、搜索、终端、SWE、Android、Web 和操作系统交互。
Qwen-AgentWorld-35B-A3B 用于编程?
Qwen-AgentWorld-35B-A3B 是 Qwen 系列的新模型变体,专门用于编程任务。
@ModelScope2022: Qwen-AgentWorld 刚刚在 ModelScope 上发布了两项更新!一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型,支持 256K 上下文…
Qwen-AgentWorld 发布了一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型,支持 256K 上下文,同时推出了一个涵盖 7 个领域的基准测试,在 AgentWorldBench 上取得了最先进的性能。
Qwen-AgentWorld-397B-A17B
Qwen 发布了新的大语言模型 Qwen-AgentWorld-397B-A17B,详情请见 HuggingFace 和 Qwen 博客。
Qwen/Qwen3.6-35B-A3B
Qwen 发布 Qwen3.6-35B-A3B,一款开源权重的混合专家(MoE)模型,总参数量 35B,激活参数量 3B,在智能体编码和推理能力保持方面实现显著提升。