frankenmerge

标签

Cards List
#frankenmerge

Jackrong/Qwopus-GLM-18B-Merged-GGUF

Hugging Face Models Trending · 2026-04-18 缓存

Jackrong 发布了 Qwopus-GLM-18B-Merged-GGUF,这是一个结合两个 Qwen3.5-9B 微调模型的 64 层“弗兰肯合并”模型,参数规模约 18B。通过 1000 步 LoRA 微调修复了层边界问题。该模型在能力基准测试中达到 90.9%,而显存消耗不到 Qwen 3.6-35B MoE 的一半。

0 人收藏 0 人点赞
#frankenmerge

KyleHessling1/Qwopus-GLM-18B-Merged-GGUF

Hugging Face Models Trending · 2026-04-17 缓存

实验性 18B 参数模型:将两个 Qwen-3.5-9B 微调模型堆叠后,用 1000 步 QLoRA“缝合”层边界;生成的 GGUF 在 44 项测试集上超越 Qwen 3.6-35B MoE,却只占 9.2 GB 显存。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈