@AdinaYakup: Qwen 发布了 WebWorld,一个用于 Web Agent 的开放世界模型系列(8B/14B/32B),附带数据集,采用 Apache 2.0 许可证,在 MiniWob++ 上提升 9.9%,在 W…
摘要
Qwen 发布了 WebWorld,这是一个用于 Web Agent 的开源模型系列(8B/14B/32B),采用 Apache 2.0 许可证,在 MiniWob++ 和 WebArena 基准测试中提升了性能。
查看缓存全文
缓存时间: 2026/05/11 08:35
Qwen 发布了 WebWorld 🌍,这是一个专为 Web 智能体设计的开放世界模型系列
✨ 提供 8B、14B、32B 版本及配套数据集 ✨ Apache 2.0 开源许可证 ✨ 在 MiniWob++ 基准上提升 9.9%,在 WebArena 基准上提升 10.9% ✨ 在事实性方面与 Claude Opus 4.1 和 Gemini 3 Pro 持平,作为世界模型表现优于 GPT-5 ✨ 统一动作空间,支持 30+ 步模拟,涵盖 5 种状态 https://t.co/X6RL4vxIqp
相似文章
@ModelScope2022: Qwen-AgentWorld 刚刚在 ModelScope 上发布了两项更新!一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型,支持 256K 上下文…
Qwen-AgentWorld 发布了一个开放的 35B 总参数量/3B 激活参数的 MoE 世界模型,支持 256K 上下文,同时推出了一个涵盖 7 个领域的基准测试,在 AgentWorldBench 上取得了最先进的性能。
Qwen/Qwen-AgentWorld-35B-A3B
Qwen 发布 Qwen-AgentWorld-35B-A3B,这是一个原生语言世界模型,能够通过长链思维推理模拟七个领域的智能体环境。该模型采用三阶段流水线训练,支持 MCP、搜索、终端、SWE、Android、Web 和操作系统交互。
Qwen-AgentWorld-397B-A17B
Qwen 发布了新的大语言模型 Qwen-AgentWorld-397B-A17B,详情请见 HuggingFace 和 Qwen 博客。
Qwen3.7:智能代理前沿(15分钟阅读)
阿里巴巴Qwen团队发布了Qwen3.7-Max,这是一款专有智能代理基础模型,在Terminal-Bench 2.0、SWE-Pro、GPQA Diamond等多个基准测试中取得最高分,并在多种代码环境中表现一致。
Qwen-AgentWorld: 通用智能体的语言世界模型
Qwen-AgentWorld 引入了适用于智能体环境的语言世界模型,涵盖七个领域,并具备长链思维推理能力。该工作包含一个新基准 AgentWorldBench,并且表明世界建模能够提升下游智能体的性能。