4-bit

标签

Cards List
#4-bit

@UnslothAI:4-bit Qwen3.6 MTP GGUF 成功从单个提示中搜索70多个网站。通过 Unsloth Studio 在20GB内存上本地尝试…

X AI KOLs Timeline · 2026-05-19 缓存

UnslothAI 宣布,其 4-bit Qwen3.6 MTP GGUF 模型仅凭单个提示即可搜索超过70个网站,通过 Unsloth Studio 可在20GB内存上本地运行。此次更新增加了自动 MTP 和推测解码支持。

0 人收藏 0 人点赞
#4-bit

介绍 cyankiwi AWQ 4-bit 量化——26.05 更新

Reddit r/LocalLLaMA · 2026-05-14

Cyankiwi 推出了其 AWQ 4-bit 量化方法的更新版本,该方法联合优化缩放因子和量化范围,在 Llama-3 模型上实现了比现有方法更低的 KL 散度。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈