POV：带思考模式的 Qwen 3.5

Reddit r/LocalLLaMA 2026/04/23 12:19 模型

qwen thinking-loops behavior recursion

摘要

用户观察到 Qwen 3.5 在生成时陷入重复思考循环。

我的意思是我没说错吧。（qwen 就爱陷入思考死循环）等等，qwen 就爱陷入思考死循环等等，qwen 就爱陷入思考死循环然而，qwen 就爱陷入思考死循环

查看原文

相似文章

Reddit r/LocalLLaMA

讨论Pi编码代理如何在llama-server上控制Qwen 35B A3B模型的思考长度，而其他客户端却无法做到。

Reddit r/LocalLLaMA

一个个人项目最终产出了一篇ACL 2026论文，介绍了TIME方法，训练Qwen3模型进行短时、上下文触发的思考，而非过度推理。该工作使用了QLoRA和四阶段课程，所有数据和代码均已开源发布。

Hugging Face Models Trending

Qwen 在 Hugging Face 上发布了开源权重模型 Qwen3.6-27B，该模型具备更高的稳定性、强大的智能体编程能力以及思维链保留特性，有助于提升开发者的工作效率。

Hugging Face Models Trending

阿里巴巴发布了Qwen3.6-35B-A3B-FP8，这是Qwen3.6的开源权重量化变体，拥有35B参数，通过MoE激活3B，具有改进的智能编码能力和保持思维链的迭代开发特性。

TLDR AI

Qwen-RobotWorld技术报告提出了一种统一的、语言条件化的视频世界模型，用于具身智能，能够从当前观测中预测未来视频，涵盖机器人、自动驾驶、导航等多个领域，并应用于合成数据生成、策略评估和规划。