@MiaAI_lab: MTP 已上线,试试吧 https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP…

X AI KOLs Timeline 模型

摘要

Mia-AiLab 发布了 Qwable-3.6-27b-MTP,这是基于 Qwen3.6-27B 的完整微调检查点,使用了经过清洗的 Fable 5 推理与指令数据集,专注于代码、结构化推理以及带有 MTP 层的本地推理。

MTP 已上线,试试吧 https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP…
查看原文
查看缓存全文

缓存时间: 2026/06/17 09:53

MTP 已上线,快来试试吧 https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP…


Mia-AiLab/Qwable-3.6-27b-MTP · Hugging Face

来源:https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP Qwable 27B

Qwable 27B 是一个完整的 Hugging Face 检查点,基于 qwen/Qwen3.6-27B 在清洗后的 Fable 5 风格推理与指令数据集上进行微调。

该模型的目标很简单:以强大的 Qwen 27B 为基础,推动其向更刻意、结构化、类似跟踪的助手行为发展,特别是在代码、技术推理和指令遵循工作流方面。

不是 LoRA 适配器。此仓库包含完整的微调模型检查点

在 X 上关注 Mia (https://x.com/MiaAI_lab)


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#highlights 亮点

  • 基座模型:qwen/Qwen3.6-27B
  • **检查点类型:**完整 HF 模型检查点
  • **训练方式:**指令微调,使用跟踪/推理风格示例
  • **数据集:**清洗后的 Fable 5 推理/指令数据集
  • **主要关注点:**编码、结构化回答、技术辅助和本地推理
  • **MTP:**此检查点中包含
  • **本地友好目标:**设计时已考虑后续 GGUF 转换

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#model-summary 模型概要

字段
基座模型qwen/Qwen3.6-27B
架构Qwen3_5ForConditionalGeneration
模型类型qwen3_5
检查点类型完整 HF 检查点
PEFT / LoRA
MTP 层存在
训练方式指令 + 跟踪风格微调
主要用途代码、推理、结构化助手响应

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#what-this-model-is-good-at 该模型擅长什么

Qwable 27B 经过调优,适用于希望模型生成更有条理、更周到的响应的工作流。

它适用于:

  • 结构化指令遵循
  • 面向代码的生成与编辑
  • 技术调试辅助
  • 跟踪式助手响应
  • 推理密集型提示
  • 本地模型实验
  • 下游转换为 GGUF,用于 llama.cpp、LM Studio 或其他本地运行环境

该模型在风格上应与基座检查点有所不同: 更具引导性、更具解释性,更注重逐步完成任务。

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#how-to-use 如何使用

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#transformers Transformers

from transformers import AutoTokenizer, Qwen3_5ForConditionalGeneration
import torch

model_id = "your-org-or-username/Qwable-27B"

tokenizer = AutoTokenizer.from_pretrained(
    model_id,
    trust_remote_code=True,
)

model = Qwen3_5ForConditionalGeneration.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
)

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#simple-generation-example 简单生成示例

messages = [
    {
        "role": "user",
        "content": "编写一个 Python 函数,用于验证用于聊天消息的 JSONL 训练文件。"
    }
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
)

inputs = tokenizer(text, return_tensors="pt").to(model.device)

outputs = model.generate(
    **inputs,
    max_new_tokens=1024,
    temperature=0.6,
    top_p=0.95,
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#suggested-generation-settings 建议的生成设置

这些仅是起点。根据您的运行环境和用例进行调整。

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#balanced 平衡

temperature: 0.6
top_p: 0.95
min_p: 0.02
max_new_tokens: 1024-4096

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#more-deterministic-coding 更确定的编码

temperature: 0.2-0.4
top_p: 0.9
max_new_tokens: 2048-4096

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#more-creative-reasoning 更具创意的推理

temperature: 0.7-0.9
top_p: 0.95
max_new_tokens: 2048-8192

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#gguf–local-inference-notes GGUF / 本地推理说明

此检查点旨在可转换为 GGUF 以进行本地推理。

重要说明:

  • 此检查点包含 MTP 层
  • 将模型用作普通的 Qwen 风格因果 LM 检查点。
  • 转换为 GGUF 时,在发布前验证转换后的模型。
  • 在假设转换正确之前,始终测试文本生成。

转换后的推荐验证提示:

用三个简短段落解释这个模型是什么。
编写一个 Python 脚本,读取 JSONL 文件并检查每一行是否包含 messages 数组。
给你一个损坏的 Docker Compose 文件。解释你将如何逐步调试它。

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#intended-use 预期用途

Qwable 27B 适用于研究、实验、本地推理和助手风格的工作流。

好的用例包括:

  • 编码助手
  • 技术写作
  • 调试帮助
  • 本地代理实验
  • 指令遵循基准测试
  • 推理风格的助手响应
  • 合成数据实验

此模型不保证在没有额外评估的情况下安全、正确或可投入生产。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#limitations 限制

与所有微调的语言模型一样,Qwable 27B 可能会产生不正确、不完整或具有误导性的输出。

已知限制:

  • 可能继承基座模型的限制。
  • 可能反映训练数据集中的偏见或伪影。
  • 可能给出自信但错误的技术答案。
  • 在安全行为、拒绝行为以及写作风格方面可能与基座模型有所不同。
  • 尚未针对高风险用例进行验证。

在将其用于生产、安全敏感、医疗、法律、金融或安全关键环境之前,请始终验证输出。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#reproducibility 可重复性

训练和导出工具位于生成此检查点的 DSv4-Tune 工作流中。

微调路径使用:

data/processed/train.jsonl

该文件包含用于运行的标准聊天格式训练示例。

建议的可重复性检查清单:

  • 验证基座模型版本
  • 验证分词器文件
  • 验证处理后的 JSONL 数据集
  • 保存训练配置
  • 记录确切的导出命令
  • 在转换前测试导出的检查点
  • 如果发布本地构建,则单独测试转换后的 GGUF

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#naming 命名

Qwable = Qwen + Fable。

该名称反映了模型的目标:将 Qwen 27B 基座与 Fable 风格的推理和助手跟踪相结合。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#license 许可证

仓库元数据和训练/导出文件根据 MIT 许可证发布。

底层基座模型 qwen/Qwen3.6-27B 可能拥有自己的许可条款。用户有责任在使用、修改或重新分发此检查点之前,审查并遵守基座模型许可证以及任何数据集许可证要求。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP#disclaimer 免责声明

这是一个实验性微调模型。

它用于研究和本地实验。不提供任何保证。在将其用于实际部署之前,请仔细验证。

Mia (@MiaAI_lab): 我已经将 Qwable 3.6 27b 发布到 HF

Qwable = Qwen + Fable。

基于 Qwen 27B,采用 Fable 风格的推理和助手跟踪。

立即获取并自行测试。

相似文章

Mia-AiLab/Qwable-3.6-27b

Hugging Face Models Trending

Mia-AiLab 发布了 Qwable-3.6-27b,这是一个基于清理后的推理和指令数据集对 Qwen3.6-27B 进行全参数微调的检查点,针对编程、技术辅助和结构化回复进行了优化。

unsloth/Qwen3.6-35B-A3B-MTP-GGUF

Hugging Face Models Trending

本文宣布在 Hugging Face 上发布 Qwen3.6-35B-A3B 模型权重,该模型由 Unsloth 进行优化,并采用多令牌预测(MTP)技术,以通过 llama.cpp 实现更快的生成速度。文章重点介绍了其在智能体编码能力、工具调用以及推理上下文保留方面的改进。