@ModelScope2022: Qwen-AgentWorld 刚刚在 ModelScope 上发布了两项更新！一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型，支持 256K 上下文…

X AI KOLs Timeline 2026/06/24 03:39 模型

qwen agent-world moe world-model open-source benchmark ai-agents

摘要

Qwen-AgentWorld 发布了一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型，支持 256K 上下文，同时推出了一个涵盖 7 个领域的基准测试，在 AgentWorldBench 上取得了最先进的性能。

Qwen-AgentWorld 刚刚在 ModelScope 上发布了两项更新！一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型，支持 256K 上下文，以及一个基于真实环境观察的 7 领域基准测试。 https://modelscope.ai/collections/Qwen/Qwen-AgentWorld… Qwen-AgentWorld-35B-A3B 一个模型适用于 7 种智能体环境：MCP、搜索、终端、SWE、Web、操作系统和 Android 在 AgentWorldBench 上从 47.73 提升至 56.39，超越 Claude Sonnet 4.6 的 56.04 三阶段训练：CPT 注入环境知识，SFT 激活下一状态预测推理，RL 提升模拟保真度 AgentWorldBench 涵盖 7 个领域，包含 2,170 个样本，平均轮次 22.8 从格式、事实性、一致性、真实性和质量方面对预测进行评分

查看原文

查看缓存全文

缓存时间: 2026/06/24 12:24

Qwen-AgentWorld 刚刚在 ModelScope 上发布了两个新版本！一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型，支持 256K 上下文，以及一个基于真实环境观察的 7 领域基准测试。 https://modelscope.ai/collections/Qwen/Qwen-AgentWorld…

Qwen-AgentWorld-35B-A3B 一个模型覆盖 7 种智能体环境：MCP、搜索、终端、SWE、Web、OS 和 Android 在 AgentWorldBench 上从 47.73 提升到 56.39，超越 Claude Sonnet 4.6 的 56.04 三阶段训练：CPT 注入环境知识，SFT 激活下一状态预测推理，RL 提升模拟保真度

AgentWorldBench 覆盖 7 个领域，共 2,170 个样本，平均 22.8 轮从格式、事实性、一致性、真实性和质量五个维度对预测进行评分

@ModelScope2022: Qwen-AgentWorld 刚刚在 ModelScope 上发布了两项更新！一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型，支持 256K 上下文…

相似文章

@AdinaYakup: Qwen 发布了 WebWorld，一个用于 Web Agent 的开放世界模型系列（8B/14B/32B），附带数据集，采用 Apache 2.0 许可证，在 MiniWob++ 上提升 9.9%，在 W…

Qwen-AgentWorld-35B-A3B：一个3B激活参数的MoE模型，用于模拟MCP、终端、软件工程、安卓、网页和操作系统环境

Qwen/Qwen-AgentWorld-35B-A3B

Qwen-AgentWorld: 通用智能体的语言世界模型

Qwen-AgentWorld-397B-A17B

提交意见反馈