@antirez:上传新的 2-bit HF imatrix GGUF:名称相同但内容不同,已修复共享专家的 down layer(原存在…

X AI KOLs Following 模型

摘要

修复 imatrix 计算 bug 后,已将修正后的 2-bit GGUF 模型文件上传至 Hugging Face,从而提升了 logits 召回率并降低了误差。

上传新的 2-bit HF imatrix GGUF:名称相同但内容不同,已修复共享专家的 down layer(原 imatrix 计算中存在 bug)。logits 召回率有所提升,误差减小,...
查看原文

相似文章

KyleHessling1/Qwopus-GLM-18B-Merged-GGUF

Hugging Face Models Trending

实验性 18B 参数模型:将两个 Qwen-3.5-9B 微调模型堆叠后,用 1000 步 QLoRA“缝合”层边界;生成的 GGUF 在 44 项测试集上超越 Qwen 3.6-35B MoE,却只占 9.2 GB 显存。

LiquidAI/LFM2.5-8B-A1B-GGUF

Hugging Face Models Trending

LiquidAI 发布了其 LFM2.5-8B-A1B 模型的 GGUF 量化版本,并提供了在多个推理引擎上的使用说明。