healing

#healing

KyleHessling1/Qwopus-GLM-18B-Merged-GGUF

Hugging Face Models Trending ↗ · 2026-04-17 缓存

实验性 18B 参数模型：将两个 Qwen-3.5-9B 微调模型堆叠后，用 1000 步 QLoRA“缝合”层边界；生成的 GGUF 在 44 项测试集上超越 Qwen 3.6-35B MoE，却只占 9.2 GB 显存。

0 人收藏 0 人点赞