unsloth

标签

Cards List
#unsloth

Unsloth 登陆 Apple Silicon - 预公告

Reddit r/LocalLLaMA · 2026-06-04

Unsloth,一款流行的 LLM 微调库,宣布即将支持 Apple Silicon 设备,将其优化能力扩展至 NVIDIA GPU 之外。

0 人收藏 0 人点赞
#unsloth

@UnslothAI:我们编写了一份关于在本地LLM中使用MCP的指南。连接Qwen3.6和Gemma 4,实现对工具、文件、API等的受控访问……

X AI KOLs Timeline · 2026-06-01 缓存

一份逐步指南,介绍如何通过Unsloth和llama.cpp在Qwen3.6和Gemma 4等本地LLM中使用MCP服务器,从而利用工具、文件及API实现私有的自动化工作流。

0 人收藏 0 人点赞
#unsloth

@neural_avb: 下一个视频是关于训练小型(<1B)模型用于偏好调优。以及如何使用本地模型生成偏好数据集…

X AI KOLs Timeline · 2026-05-26 缓存

宣布即将发布一个关于训练小型模型用于偏好调优的视频,涵盖奖励模型、RLHF、DPO、ORPO,以及Unsloth和TRL的使用。

0 人收藏 0 人点赞
#unsloth

@UnslothAI:4-bit Qwen3.6 MTP GGUF 成功从单个提示中搜索70多个网站。通过 Unsloth Studio 在20GB内存上本地尝试…

X AI KOLs Timeline · 2026-05-19 缓存

UnslothAI 宣布,其 4-bit Qwen3.6 MTP GGUF 模型仅凭单个提示即可搜索超过70个网站,通过 Unsloth Studio 可在20GB内存上本地运行。此次更新增加了自动 MTP 和推测解码支持。

0 人收藏 0 人点赞
#unsloth

@populartourist: Unsloth Qwen3.6 27B Q6_K 在 RTX 5090 上通过 MTP 实现超过 100 令牌/秒。相比没有 MTP 时的 45-50 令牌/秒大幅提升。这真是太…

X AI KOLs Timeline · 2026-05-16 缓存

Unsloth Qwen3.6 27B Q6_K 在 RTX 5090 上通过 MTP 达到每秒超过 100 个令牌,相比没有 MTP 时的 45-50 令牌/秒显著提升。

0 人收藏 0 人点赞
#unsloth

你最喜欢的量化模型发布者是谁?为什么?

Reddit r/LocalLLaMA · 2026-05-13

一位用户分享了对Unsloth量化模型的偏好,原因包括发布速度快、困惑度低,并将其与Apex MoE量化模型进行比较,同时向社区询问他们最喜欢的量化发布者。

0 人收藏 0 人点赞
#unsloth

@_lewtun: 你现在可以在笔记本上免费全天候运行 AI 研究员了!使用 llama.cpp 和 4-bi…

X AI KOLs Timeline · 2026-05-13 缓存

本文重点介绍了如何在本地笔记本上使用 llama.cpp 和 Unsloth 4-bit 量化免费运行 Qwen3-35B-A3B。

0 人收藏 0 人点赞
#unsloth

@billtheinvestor: 你现在可以在浏览器中免费微调 Google 的 Gemma 4。只需打开 Unsloth Colab 笔记本,选择你的模型和数据集,然后点击开始。 定制模型的门槛已降至零。

X AI KOLs Timeline · 2026-05-12 缓存

该推文宣布用户现可通过 Unsloth Colab 笔记本,在浏览器中免费微调 Google 的 Gemma 4 模型,极大降低了自定义模型的门槛。

0 人收藏 0 人点赞
#unsloth

@TeksEdge: Unsloth 发布了目前我测试过的最快的 Qwen3.6-27B MTP GGUF。是时候升级了。与之前的 GGUF 相比,Q4/Q6 XL 版本的推理速度快了约 55%…

X AI KOLs Timeline · 2026-05-12

Unsloth 发布了优化后的 Qwen3.6-27B MTP 模型 GGUF 版本,与前序量化版本相比,推理速度显著提升(在 RTX 5090 上最高可达 114 tok/s)。

0 人收藏 0 人点赞
#unsloth

@Italianclownz:在 @UnslothAI 和 @Alibaba_Qwen Qwen 3.6 35B A3B MTP MXFP4_MoE 模型上测试了 MTP、TriAttention 和 TurboQuant,发布在 @huggingface @no_stp…

X AI KOLs Following · 2026-05-12 缓存

一名用户在消费级硬件上使用 Unsloth 对 Qwen 3.6 35B 进行了基准测试,对比了 MTP、TriAttention 和 TurboQuant 优化效果,发现 TurboQuant 最为有效。

0 人收藏 0 人点赞
#unsloth

@port_dev: https://x.com/port_dev/status/2054259445732110408

X AI KOLs Timeline · 2026-05-12 缓存

本文提供了一份详细教程,介绍如何通过 Unsloth Studio 和 Pi 编码框架配置基于 Qwen3.6-27B 的本地编码智能体。文章强调了使用 GGUF 量化模型在消费级硬件(如搭载 Apple Silicon 芯片的 Mac 电脑)上实现高效推理的优势。

0 人收藏 0 人点赞
#unsloth

Unsloth 上的 MTP

Reddit r/LocalLLaMA · 2026-05-11

Unsloth 发布了支持多 Token 预测 (MTP) 的 Qwen3.6 模型 GGUF 量化版本。

0 人收藏 0 人点赞
#unsloth

unsloth/Qwen3.6-35B-A3B-MTP-GGUF

Hugging Face Models Trending · 2026-05-11 缓存

本文宣布在 Hugging Face 上发布 Qwen3.6-35B-A3B 模型权重,该模型由 Unsloth 进行优化,并采用多令牌预测(MTP)技术,以通过 llama.cpp 实现更快的生成速度。文章重点介绍了其在智能体编码能力、工具调用以及推理上下文保留方面的改进。

0 人收藏 0 人点赞
#unsloth

unsloth/Qwen3.6-27B-MTP-GGUF

Hugging Face Models Trending · 2026-05-11 缓存

Unsloth 发布了 Qwen3.6-27B 模型的 GGUF 权重,该模型支持多令牌预测(MTP),可实现更快的生成速度并增强了智能体(Agentic)编码能力。

0 人收藏 0 人点赞
#unsloth

@Suryanshti777: NVIDIA刚刚揭秘了它们用来让LLM微调显著加速的隐藏技巧。不是新GPU。不是大…

X AI KOLs Timeline · 2026-05-07

NVIDIA和Unsloth发布了一篇技术指南,详细介绍了三种底层优化方法,可将LLM微调速度提升高达25%,包括打包序列缓存、双缓冲检查点存储和优化的MoE路由。该指南提供了深入的系统级解释和基准测试,面向机器学习工程师和开发者。

0 人收藏 0 人点赞
#unsloth

havenoammo/Qwen3.6-27B-MTP-UD-GGUF

Hugging Face Models Trending · 2026-05-06 缓存

该 Hugging Face 仓库提供了 Qwen3.6-27B 的 GGUF 文件,这些文件在 Unsloth UD XL 量化版本的基础上嫁接了多 Token 预测 (MTP) 层。它还包含了构建支持 MTP 的 llama.cpp 的说明,以实现投机解码。

0 人收藏 0 人点赞
#unsloth

Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF

Hugging Face Models Trending · 2026-04-29 缓存

本文档介绍 Qwen3.5-9B-DeepSeek-V4-Flash,这是一款通过知识蒸馏技术将 DeepSeek-V4 的推理能力迁移至 9B 参数小模型中的 AI 模型,旨在实现高效推理。

0 人收藏 0 人点赞
#unsloth

Qwen 3.6 其实很适合 vibe-coding,而且比 Claude 便宜多了

Reddit r/LocalLLaMA · 2026-04-23

用户展示了在本地使用 llama-server 运行 Qwen 3.6 27B/35B,将 Claude Code 的 API 成本从 142 美元降至 8 小时 vibe-coding 会话不到 4 美元,4500 美元的双 RTX 3090 设备可在 30 天内回本。

0 人收藏 0 人点赞
#unsloth

unsloth/Qwen3.6-27B-GGUF

Hugging Face Models Trending · 2026-04-22 缓存

Unsloth 发布了 Qwen3.6-27B 模型的 GGUF 量化版本,具备更强的智能体编程能力、工具调用功能,并支持 Unsloth Studio。

0 人收藏 0 人点赞
#unsloth

Kimi K2.6 Unsloth GGUF 已发布

Reddit r/LocalLLaMA · 2026-04-21

Unsloth 推出了 Kimi K2.6 的 GGUF 量化版本,可在本地高效推理。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈