@MiaAI_lab: MTP 已上线,试试吧 https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP…
摘要
Mia-AiLab 发布了 Qwable-3.6-27b-MTP,这是基于 Qwen3.6-27B 的完整微调检查点,使用了经过清洗的 Fable 5 推理与指令数据集,专注于代码、结构化推理以及带有 MTP 层的本地推理。
查看缓存全文
缓存时间: 2026/06/17 09:53
MTP 已上线,快来试试吧 https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP…
Mia-AiLab/Qwable-3.6-27b-MTP · Hugging Face
来源:https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP Qwable 27B
Qwable 27B 是一个完整的 Hugging Face 检查点,基于 qwen/Qwen3.6-27B 在清洗后的 Fable 5 风格推理与指令数据集上进行微调。
该模型的目标很简单:以强大的 Qwen 27B 为基础,推动其向更刻意、结构化、类似跟踪的助手行为发展,特别是在代码、技术推理和指令遵循工作流方面。
这不是 LoRA 适配器。此仓库包含完整的微调模型检查点。
在 X 上关注 Mia (https://x.com/MiaAI_lab)
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#highlights 亮点
- 基座模型:
qwen/Qwen3.6-27B - **检查点类型:**完整 HF 模型检查点
- **训练方式:**指令微调,使用跟踪/推理风格示例
- **数据集:**清洗后的 Fable 5 推理/指令数据集
- **主要关注点:**编码、结构化回答、技术辅助和本地推理
- **MTP:**此检查点中包含
- **本地友好目标:**设计时已考虑后续 GGUF 转换
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#model-summary 模型概要
| 字段 | 值 |
|---|---|
| 基座模型 | qwen/Qwen3.6-27B |
| 架构 | Qwen3_5ForConditionalGeneration |
| 模型类型 | qwen3_5 |
| 检查点类型 | 完整 HF 检查点 |
| PEFT / LoRA | 否 |
| MTP 层 | 存在 |
| 训练方式 | 指令 + 跟踪风格微调 |
| 主要用途 | 代码、推理、结构化助手响应 |
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#what-this-model-is-good-at 该模型擅长什么
Qwable 27B 经过调优,适用于希望模型生成更有条理、更周到的响应的工作流。
它适用于:
- 结构化指令遵循
- 面向代码的生成与编辑
- 技术调试辅助
- 跟踪式助手响应
- 推理密集型提示
- 本地模型实验
- 下游转换为 GGUF,用于 llama.cpp、LM Studio 或其他本地运行环境
该模型在风格上应与基座检查点有所不同: 更具引导性、更具解释性,更注重逐步完成任务。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#how-to-use 如何使用
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#transformers Transformers
from transformers import AutoTokenizer, Qwen3_5ForConditionalGeneration
import torch
model_id = "your-org-or-username/Qwable-27B"
tokenizer = AutoTokenizer.from_pretrained(
model_id,
trust_remote_code=True,
)
model = Qwen3_5ForConditionalGeneration.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto",
trust_remote_code=True,
)
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#simple-generation-example 简单生成示例
messages = [
{
"role": "user",
"content": "编写一个 Python 函数,用于验证用于聊天消息的 JSONL 训练文件。"
}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
)
inputs = tokenizer(text, return_tensors="pt").to(model.device)
outputs = model.generate(
**inputs,
max_new_tokens=1024,
temperature=0.6,
top_p=0.95,
)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#suggested-generation-settings 建议的生成设置
这些仅是起点。根据您的运行环境和用例进行调整。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#balanced 平衡
temperature: 0.6
top_p: 0.95
min_p: 0.02
max_new_tokens: 1024-4096
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#more-deterministic-coding 更确定的编码
temperature: 0.2-0.4
top_p: 0.9
max_new_tokens: 2048-4096
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#more-creative-reasoning 更具创意的推理
temperature: 0.7-0.9
top_p: 0.95
max_new_tokens: 2048-8192
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#gguf–local-inference-notes GGUF / 本地推理说明
此检查点旨在可转换为 GGUF 以进行本地推理。
重要说明:
- 此检查点包含 MTP 层。
- 将模型用作普通的 Qwen 风格因果 LM 检查点。
- 转换为 GGUF 时,在发布前验证转换后的模型。
- 在假设转换正确之前,始终测试文本生成。
转换后的推荐验证提示:
用三个简短段落解释这个模型是什么。
编写一个 Python 脚本,读取 JSONL 文件并检查每一行是否包含 messages 数组。
给你一个损坏的 Docker Compose 文件。解释你将如何逐步调试它。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#intended-use 预期用途
Qwable 27B 适用于研究、实验、本地推理和助手风格的工作流。
好的用例包括:
- 编码助手
- 技术写作
- 调试帮助
- 本地代理实验
- 指令遵循基准测试
- 推理风格的助手响应
- 合成数据实验
此模型不保证在没有额外评估的情况下安全、正确或可投入生产。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#limitations 限制
与所有微调的语言模型一样,Qwable 27B 可能会产生不正确、不完整或具有误导性的输出。
已知限制:
- 可能继承基座模型的限制。
- 可能反映训练数据集中的偏见或伪影。
- 可能给出自信但错误的技术答案。
- 在安全行为、拒绝行为以及写作风格方面可能与基座模型有所不同。
- 尚未针对高风险用例进行验证。
在将其用于生产、安全敏感、医疗、法律、金融或安全关键环境之前,请始终验证输出。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#reproducibility 可重复性
训练和导出工具位于生成此检查点的 DSv4-Tune 工作流中。
微调路径使用:
data/processed/train.jsonl
该文件包含用于运行的标准聊天格式训练示例。
建议的可重复性检查清单:
- 验证基座模型版本
- 验证分词器文件
- 验证处理后的 JSONL 数据集
- 保存训练配置
- 记录确切的导出命令
- 在转换前测试导出的检查点
- 如果发布本地构建,则单独测试转换后的 GGUF
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#naming 命名
Qwable = Qwen + Fable。
该名称反映了模型的目标:将 Qwen 27B 基座与 Fable 风格的推理和助手跟踪相结合。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#license 许可证
仓库元数据和训练/导出文件根据 MIT 许可证发布。
底层基座模型 qwen/Qwen3.6-27B 可能拥有自己的许可条款。用户有责任在使用、修改或重新分发此检查点之前,审查并遵守基座模型许可证以及任何数据集许可证要求。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#disclaimer 免责声明
这是一个实验性微调模型。
它用于研究和本地实验。不提供任何保证。在将其用于实际部署之前,请仔细验证。
Mia (@MiaAI_lab): 我已经将 Qwable 3.6 27b 发布到 HF
Qwable = Qwen + Fable。
基于 Qwen 27B,采用 Fable 风格的推理和助手跟踪。
立即获取并自行测试。
相似文章
Mia-AiLab/Qwable-3.6-27b
Mia-AiLab 发布了 Qwable-3.6-27b,这是一个基于清理后的推理和指令数据集对 Qwen3.6-27B 进行全参数微调的检查点,针对编程、技术辅助和结构化回复进行了优化。
@ggerganov: llama.cpp 为 Qwen3.6 系列添加 MTP 支持,这是本地AI生态系统的一个重要里程碑。性能提…
llama.cpp 为 Qwen3.6 系列添加了多令牌预测(MTP)支持,为在普通硬件上进行本地AI推理带来了巨大的性能提升。
unsloth/Qwen3.6-35B-A3B-MTP-GGUF
本文宣布在 Hugging Face 上发布 Qwen3.6-35B-A3B 模型权重,该模型由 Unsloth 进行优化,并采用多令牌预测(MTP)技术,以通过 llama.cpp 实现更快的生成速度。文章重点介绍了其在智能体编码能力、工具调用以及推理上下文保留方面的改进。
@Italianclownz:在 @UnslothAI 和 @Alibaba_Qwen Qwen 3.6 35B A3B MTP MXFP4_MoE 模型上测试了 MTP、TriAttention 和 TurboQuant,发布在 @huggingface @no_stp…
一名用户在消费级硬件上使用 Unsloth 对 Qwen 3.6 35B 进行了基准测试,对比了 MTP、TriAttention 和 TurboQuant 优化效果,发现 TurboQuant 最为有效。
在 Qwen3.6 - RTX 5090 上测试 llama.cpp 的 MTP 支持
在 RTX 5090 上使用 Qwen3.6 模型对 llama.cpp 的新多标记预测(MTP)支持进行技术测试,比较不同提示和 GGUF 量化下开启和关闭 MTP 的性能表现。