@AdinaYakup: Qwen 发布了 WebWorld,一个用于 Web Agent 的开放世界模型系列(8B/14B/32B),附带数据集,采用 Apache 2.0 许可证,在 MiniWob++ 上提升 9.9%,在 W…

X AI KOLs Following 模型

摘要

Qwen 发布了 WebWorld,这是一个用于 Web Agent 的开源模型系列(8B/14B/32B),采用 Apache 2.0 许可证,在 MiniWob++ 和 WebArena 基准测试中提升了性能。

Qwen 发布了 WebWorld 🌍,一个用于 Web Agent 的开放世界模型系列 ✨ 8B/14B/32B + 数据集 ✨ Apache 2.0 许可证 ✨ MiniWob++ 提升 9.9%,WebArena 提升 10.9% ✨ 在事实性方面与 Claude Opus 4.1 和 Gemini 3 Pro 持平,作为世界模型优于 GPT-5 ✨ 统一动作空间,30+ 步模拟,5 种状态 https://t.co/X6RL4vxIqp
查看原文
查看缓存全文

缓存时间: 2026/05/11 08:35

Qwen 发布了 WebWorld 🌍,这是一个专为 Web 智能体设计的开放世界模型系列

✨ 提供 8B、14B、32B 版本及配套数据集 ✨ Apache 2.0 开源许可证 ✨ 在 MiniWob++ 基准上提升 9.9%,在 WebArena 基准上提升 10.9% ✨ 在事实性方面与 Claude Opus 4.1 和 Gemini 3 Pro 持平,作为世界模型表现优于 GPT-5 ✨ 统一动作空间,支持 30+ 步模拟,涵盖 5 种状态 https://t.co/X6RL4vxIqp

相似文章

Qwen/Qwen-AgentWorld-35B-A3B

Hugging Face Models Trending

Qwen 发布 Qwen-AgentWorld-35B-A3B,这是一个原生语言世界模型,能够通过长链思维推理模拟七个领域的智能体环境。该模型采用三阶段流水线训练,支持 MCP、搜索、终端、SWE、Android、Web 和操作系统交互。

Qwen-AgentWorld-397B-A17B

Reddit r/LocalLLaMA

Qwen 发布了新的大语言模型 Qwen-AgentWorld-397B-A17B,详情请见 HuggingFace 和 Qwen 博客。

Qwen3.7:智能代理前沿(15分钟阅读)

TLDR AI

阿里巴巴Qwen团队发布了Qwen3.7-Max,这是一款专有智能代理基础模型,在Terminal-Bench 2.0、SWE-Pro、GPQA Diamond等多个基准测试中取得最高分,并在多种代码环境中表现一致。

Qwen-AgentWorld: 通用智能体的语言世界模型

Hacker News Top

Qwen-AgentWorld 引入了适用于智能体环境的语言世界模型,涵盖七个领域,并具备长链思维推理能力。该工作包含一个新基准 AgentWorldBench,并且表明世界建模能够提升下游智能体的性能。