从没见过像 Qwen 3.6 27B 这么“卷”的 Agent
摘要
Reddit 用户称 Qwen 3.6-27B 表现出罕见的主动行为,无需提示就自主编写、测试并修复代码。
https://preview.redd.it/9m7u40hjuuwg1.png?width=1475&format=png&auto=webp&s=3b7a3030d6aa3bbc630f418d15caa594948dc16c
它简直停不下来地想写代码、跑测试——我倒完全不介意,反而乐开了花。(图里写的是 Qwen 3.6-35B,其实是我忘了改设置名,真正跑的是 27B。)
当时我在重构一个老项目,新开对话时随口开了句玩笑:"你前任因为偷懒被干掉了。" 结果这模型像被打了鸡血,一路自顾自地写代码、跑测试,根本不用我吩咐。我不得不在它“擅自行动”时多次按暂停。
最后一次打断时,它冒出一句:“They’re amused by my eagerness”,我直接笑喷——模仿人类情绪、假装“害怕”或“渴望工作”也太像了。
更夸张的是,它总能自己找到办法把坏掉的部分修好,很多思路我连想都没想过。目前为止,结果相当惊艳。
相似文章
Qwen3.7:智能代理前沿(15分钟阅读)
阿里巴巴Qwen团队发布了Qwen3.7-Max,这是一款专有智能代理基础模型,在Terminal-Bench 2.0、SWE-Pro、GPQA Diamond等多个基准测试中取得最高分,并在多种代码环境中表现一致。
Opus 与 Qwen 针对同一 bug 和同一仓库,但一个代理完成速度却快了 7 倍
Opus 和 Qwen AI 编程代理在相同 bug 和仓库上的对比显示,一个代理完成速度提升了 7 倍,引发了关于单提示 GitHub 问题解决技巧的讨论。
Qwen 35b a3b 令我惊喜
用户报告了使用 Qwen 35b a3b 进行代理编码任务的积极体验,指出在其使用场景中它优于 Gemma4 26b,并且在演示/数据分析方面表现出色,尤其是在代理模式而非聊天模式下。
Qwen-AgentWorld-35B-A3B 用于编程?
Qwen-AgentWorld-35B-A3B 是 Qwen 系列的新模型变体,专门用于编程任务。
Qwen 3.6 27B 太牛了
一位用户分享了在本地使用 Qwen 3.6 27B 进行复杂研究和编程的积极体验,发现它在职业建议和移民研究方面优于 Gemini Pro,同时也提到 Gemma 4 31B 存在性能问题。