unsloth

#unsloth

Unsloth 登陆 Apple Silicon - 预公告

Reddit r/LocalLLaMA ↗ · 2026-06-04

Unsloth，一款流行的 LLM 微调库，宣布即将支持 Apple Silicon 设备，将其优化能力扩展至 NVIDIA GPU 之外。

0 人收藏 0 人点赞

#unsloth

@UnslothAI：我们编写了一份关于在本地LLM中使用MCP的指南。连接Qwen3.6和Gemma 4，实现对工具、文件、API等的受控访问……

X AI KOLs Timeline ↗ · 2026-06-01 缓存

一份逐步指南，介绍如何通过Unsloth和llama.cpp在Qwen3.6和Gemma 4等本地LLM中使用MCP服务器，从而利用工具、文件及API实现私有的自动化工作流。

0 人收藏 0 人点赞

#unsloth

@neural_avb: 下一个视频是关于训练小型（<1B）模型用于偏好调优。以及如何使用本地模型生成偏好数据集…

X AI KOLs Timeline ↗ · 2026-05-26 缓存

宣布即将发布一个关于训练小型模型用于偏好调优的视频，涵盖奖励模型、RLHF、DPO、ORPO，以及Unsloth和TRL的使用。

0 人收藏 0 人点赞

#unsloth

@UnslothAI：4-bit Qwen3.6 MTP GGUF 成功从单个提示中搜索70多个网站。通过 Unsloth Studio 在20GB内存上本地尝试…

X AI KOLs Timeline ↗ · 2026-05-19 缓存

UnslothAI 宣布，其 4-bit Qwen3.6 MTP GGUF 模型仅凭单个提示即可搜索超过70个网站，通过 Unsloth Studio 可在20GB内存上本地运行。此次更新增加了自动 MTP 和推测解码支持。

0 人收藏 0 人点赞

#unsloth

@populartourist: Unsloth Qwen3.6 27B Q6_K 在 RTX 5090 上通过 MTP 实现超过 100 令牌/秒。相比没有 MTP 时的 45-50 令牌/秒大幅提升。这真是太…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

Unsloth Qwen3.6 27B Q6_K 在 RTX 5090 上通过 MTP 达到每秒超过 100 个令牌，相比没有 MTP 时的 45-50 令牌/秒显著提升。

0 人收藏 0 人点赞

#unsloth

你最喜欢的量化模型发布者是谁？为什么？

Reddit r/LocalLLaMA ↗ · 2026-05-13

一位用户分享了对Unsloth量化模型的偏好，原因包括发布速度快、困惑度低，并将其与Apex MoE量化模型进行比较，同时向社区询问他们最喜欢的量化发布者。

0 人收藏 0 人点赞

#unsloth

@_lewtun: 你现在可以在笔记本上免费全天候运行 AI 研究员了！使用 llama.cpp 和 4-bi…

X AI KOLs Timeline ↗ · 2026-05-13 缓存

本文重点介绍了如何在本地笔记本上使用 llama.cpp 和 Unsloth 4-bit 量化免费运行 Qwen3-35B-A3B。

0 人收藏 0 人点赞

#unsloth

@billtheinvestor: 你现在可以在浏览器中免费微调 Google 的 Gemma 4。只需打开 Unsloth Colab 笔记本，选择你的模型和数据集，然后点击开始。定制模型的门槛已降至零。

X AI KOLs Timeline ↗ · 2026-05-12 缓存

该推文宣布用户现可通过 Unsloth Colab 笔记本，在浏览器中免费微调 Google 的 Gemma 4 模型，极大降低了自定义模型的门槛。

0 人收藏 0 人点赞

#unsloth

@TeksEdge: Unsloth 发布了目前我测试过的最快的 Qwen3.6-27B MTP GGUF。是时候升级了。与之前的 GGUF 相比，Q4/Q6 XL 版本的推理速度快了约 55%…

X AI KOLs Timeline ↗ · 2026-05-12

Unsloth 发布了优化后的 Qwen3.6-27B MTP 模型 GGUF 版本，与前序量化版本相比，推理速度显著提升（在 RTX 5090 上最高可达 114 tok/s）。

0 人收藏 0 人点赞

#unsloth

@Italianclownz：在 @UnslothAI 和 @Alibaba_Qwen Qwen 3.6 35B A3B MTP MXFP4_MoE 模型上测试了 MTP、TriAttention 和 TurboQuant，发布在 @huggingface @no_stp…

X AI KOLs Following ↗ · 2026-05-12 缓存

一名用户在消费级硬件上使用 Unsloth 对 Qwen 3.6 35B 进行了基准测试，对比了 MTP、TriAttention 和 TurboQuant 优化效果，发现 TurboQuant 最为有效。

0 人收藏 0 人点赞

#unsloth

@port_dev: https://x.com/port_dev/status/2054259445732110408

X AI KOLs Timeline ↗ · 2026-05-12 缓存

本文提供了一份详细教程，介绍如何通过 Unsloth Studio 和 Pi 编码框架配置基于 Qwen3.6-27B 的本地编码智能体。文章强调了使用 GGUF 量化模型在消费级硬件（如搭载 Apple Silicon 芯片的 Mac 电脑）上实现高效推理的优势。

0 人收藏 0 人点赞

#unsloth

Unsloth 上的 MTP

Reddit r/LocalLLaMA ↗ · 2026-05-11

Unsloth 发布了支持多 Token 预测 (MTP) 的 Qwen3.6 模型 GGUF 量化版本。

0 人收藏 0 人点赞

#unsloth

unsloth/Qwen3.6-35B-A3B-MTP-GGUF

Hugging Face Models Trending ↗ · 2026-05-11 缓存

本文宣布在 Hugging Face 上发布 Qwen3.6-35B-A3B 模型权重，该模型由 Unsloth 进行优化，并采用多令牌预测（MTP）技术，以通过 llama.cpp 实现更快的生成速度。文章重点介绍了其在智能体编码能力、工具调用以及推理上下文保留方面的改进。

0 人收藏 0 人点赞

#unsloth

unsloth/Qwen3.6-27B-MTP-GGUF

Hugging Face Models Trending ↗ · 2026-05-11 缓存

Unsloth 发布了 Qwen3.6-27B 模型的 GGUF 权重，该模型支持多令牌预测（MTP），可实现更快的生成速度并增强了智能体（Agentic）编码能力。

0 人收藏 0 人点赞

#unsloth

@Suryanshti777: NVIDIA刚刚揭秘了它们用来让LLM微调显著加速的隐藏技巧。不是新GPU。不是大…

X AI KOLs Timeline ↗ · 2026-05-07

NVIDIA和Unsloth发布了一篇技术指南，详细介绍了三种底层优化方法，可将LLM微调速度提升高达25%，包括打包序列缓存、双缓冲检查点存储和优化的MoE路由。该指南提供了深入的系统级解释和基准测试，面向机器学习工程师和开发者。

0 人收藏 0 人点赞

#unsloth

havenoammo/Qwen3.6-27B-MTP-UD-GGUF

Hugging Face Models Trending ↗ · 2026-05-06 缓存

该 Hugging Face 仓库提供了 Qwen3.6-27B 的 GGUF 文件，这些文件在 Unsloth UD XL 量化版本的基础上嫁接了多 Token 预测 (MTP) 层。它还包含了构建支持 MTP 的 llama.cpp 的说明，以实现投机解码。

0 人收藏 0 人点赞

#unsloth

Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF

Hugging Face Models Trending ↗ · 2026-04-29 缓存

本文档介绍 Qwen3.5-9B-DeepSeek-V4-Flash，这是一款通过知识蒸馏技术将 DeepSeek-V4 的推理能力迁移至 9B 参数小模型中的 AI 模型，旨在实现高效推理。

0 人收藏 0 人点赞

#unsloth

Qwen 3.6 其实很适合 vibe-coding，而且比 Claude 便宜多了

Reddit r/LocalLLaMA ↗ · 2026-04-23

用户展示了在本地使用 llama-server 运行 Qwen 3.6 27B/35B，将 Claude Code 的 API 成本从 142 美元降至 8 小时 vibe-coding 会话不到 4 美元，4500 美元的双 RTX 3090 设备可在 30 天内回本。

0 人收藏 0 人点赞

#unsloth

unsloth/Qwen3.6-27B-GGUF

Hugging Face Models Trending ↗ · 2026-04-22 缓存

Unsloth 发布了 Qwen3.6-27B 模型的 GGUF 量化版本，具备更强的智能体编程能力、工具调用功能，并支持 Unsloth Studio。

0 人收藏 0 人点赞

#unsloth

Kimi K2.6 Unsloth GGUF 已发布

Reddit r/LocalLLaMA ↗ · 2026-04-21

Unsloth 推出了 Kimi K2.6 的 GGUF 量化版本，可在本地高效推理。

0 人收藏 0 人点赞

unsloth

提交意见反馈