qwen

#qwen

Qwen 3.6 27b Abliterated (apostate)

Reddit r/LocalLLaMA ↗ · 3天前

用户发布了Apostate，这是Qwen 3.6 27B的去安全对齐版本，将安全对齐拒绝率从92%降低到7.6%，同时能力损失极小（KL 0.120）。

0 人收藏 0 人点赞

#qwen

双Radeon R9700——在llama.cpp上运行Qwen 3.6 27B Q8 MTP

Reddit r/LocalLLaMA ↗ · 3天前

关于在使用ROCm的llama.cpp上，于双AMD Radeon R9700配置下运行Qwen 3.6 27B Q8模型的技术报告，包括性能基准测试和配置详情。

0 人收藏 0 人点赞

#qwen

Qwen永远不会开源Qwen 3.7了，对吧？

Reddit r/LocalLLaMA ↗ · 3天前

在解雇Junyang Lin之后，Qwen锁定了其大型模型，不再发布开源模型，而其他中国AI实验室继续开源最新模型。传闻小模型团队已解散，Qwen 3.6/3.7可能是最后一代开源模型。

0 人收藏 0 人点赞

#qwen

Qwen 代码助手现已上架 VS Code 市场 - 个人思考

Reddit r/LocalLLaMA ↗ · 4天前

Qwen 代码助手现已可在 VS Code 市场中获取，为开发者提供 AI 驱动的编码辅助工具。

0 人收藏 0 人点赞

#qwen

48GB VRAM + Qwen 3.6 27B 的最佳设置

Reddit r/LocalLLaMA ↗ · 4天前

一位用户分享了在双GPU配置（RTX 4090 + RTX 3090）上使用llama.cpp运行Qwen3.6 27B (Q8_0)的优化设置，在250k上下文下实现了75-100 t/s和1500 pp。

0 人收藏 0 人点赞

#qwen

@SlimTradeyBaby: 在下方列出你的GPU，我会告诉你运行什么模型和配置。开玩笑的。没必要。Qwen 3.6 27b @Unsloth…

X AI KOLs Timeline ↗ · 5天前缓存

一条推广Qwen 3.6 27b模型并推荐UnslothAI在任何GPU上运行它的推文。

0 人收藏 0 人点赞

#qwen

@LottoLabs: 这是Dflash为Qwen 3.5/6系列所做的出色工作

X AI KOLs Timeline ↗ · 5天前缓存

Charles Frye宣布与Z Lab共同发布六款新的DFlash推测器，用于阿里巴巴Qwen 3.x系列模型，在B200上为Qwen 3.5 122B-A10B实现了每秒超过1000个输出token。

0 人收藏 0 人点赞

#qwen

@charles_irl：推测就是一切。在这篇博客中，我们宣布与Z Lab共同发布六款最新的DFla…

X AI KOLs Following ↗ · 5天前缓存

Modal和Z Lab发布了六款新的DFlash推测解码草稿模型，用于Qwen 3.x，在B200上实现了每秒超过1000个token，并认为推测解码是最有影响力的推理优化。

0 人收藏 0 人点赞

#qwen

1800美元（GPU成本，使用P2P运行Qwen/Qwen3.6-27b-FP8，262K上下文，BF16 KV缓存，55 tok/s）

Reddit r/LocalLLaMA ↗ · 5天前

一位用户分享了使用4块RTX 5060 Ti 16GB显卡（支持P2P）运行Qwen3.6-27B-FP8的配置，在262K上下文下实现55 tok/s的速度，强调单用户推理成本仅约1800美元。

0 人收藏 0 人点赞

#qwen

empero-ai/Qwythos-9B-Claude-Mythos-5-1M-GGUF

Hugging Face Models Trending ↗ · 5天前缓存

Empero AI 发布了 Qwythos-9B-Claude-Mythos-5-1M-GGUF，这是一个基于 5 亿以上 tokens 的 Claude Mythos/Fable 轨迹（包含思维链）微调而成的 9B 参数推理模型，相比 Qwen3.5-9B 取得了显著提升，并通过 YaRN 旋度缩放支持 100 万 token 上下文。GGUF 量化版本支持在 llama.cpp 及兼容运行时上进行本地推理。

0 人收藏 0 人点赞

#qwen