Mia-AiLab/Qwable-3.6-27b
摘要
Mia-AiLab 发布了 Qwable-3.6-27b,这是一个基于清理后的推理和指令数据集对 Qwen3.6-27B 进行全参数微调的检查点,针对编程、技术辅助和结构化回复进行了优化。
查看缓存全文
缓存时间: 2026/06/17 23:38
Mia-AiLab/Qwable-3.6-27b · Hugging Face
来源: https://huggingface.co/Mia-AiLab/Qwable-3.6-27b Qwable 27B
Qwable 27B 是一个完整的 Hugging Face 检查点,基于 unsloth/Qwen3.6-27B 在清洗后的 Fable 5 风格推理与指令数据集上微调而成。
该模型的目标很简单:以强大的 Qwen 27B 为基础,推动其向更清晰、结构化的轨迹式助手行为发展,特别适用于代码、技术推理和指令遵循类工作流。
这不是 LoRA 适配器。此仓库包含完整的微调模型检查点。
在 X 上关注 Mia (https://x.com/MiaAI_lab)
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#highlights亮点
- 基础模型:
unsloth/Qwen3.6-27B - 检查点类型: 完整 HF 模型检查点
- 训练方式: 指令微调,配合轨迹/推理风格示例
- 数据集: 清洗后的 Fable 5 推理/指令数据集
- 主要方向: 编码、结构化回答、技术支持、本地推理
- MTP: 已禁用 / 本检查点中不包含
- 本地友好目标: 设计时已考虑下游 GGUF 转换
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#model-summary模型摘要
| 字段 | 值 |
|---|---|
| 基础模型 | unsloth/Qwen3.6-27B |
| 架构 | Qwen3_5ForConditionalGeneration |
| 模型类型 | qwen3_5 |
| 检查点类型 | 完整 HF 检查点 |
| PEFT / LoRA | 否 |
| MTP 层数 | 0 |
| 训练方式 | 指令 + 轨迹风格微调 |
| 主要用途 | 代码、推理、结构化助手的回答 |
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#what-this-model-is-good-at该模型擅长什么
Qwable 27B 面向需要模型生成更有组织性、更具思考性的回答的工作流,经过针对性的调校。
它适用于:
- 结构化指令遵循
- 以代码为核心的生成与编辑
- 技术调试辅助
- 轨迹式助手回答
- 高强度推理提示
- 本地模型实验
- 下游转换为 GGUF 以在 llama.cpp、LM Studio 或其他本地运行环境中使用
此模型的风格应与基础检查点不同: 更具引导性、更偏向解释、更注重分步完成任务。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#how-to-use如何使用
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#transformersTransformers
from transformers import AutoTokenizer, Qwen3_5ForConditionalGeneration
import torch
model_id = "your-org-or-username/Qwable-27B"
tokenizer = AutoTokenizer.from_pretrained(
model_id,
trust_remote_code=True,
)
model = Qwen3_5ForConditionalGeneration.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto",
trust_remote_code=True,
)
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#simple-generation-example简单生成示例
messages = [
{
"role": "user",
"content": "写一个 Python 函数,用于验证聊天消息的 JSONL 训练文件。"
}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
)
inputs = tokenizer(text, return_tensors="pt").to(model.device)
outputs = model.generate(
**inputs,
max_new_tokens=1024,
temperature=0.6,
top_p=0.95,
)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#gguf–local-inference-notesGGUF / 本地推理注意事项
此检查点旨在转换为 GGUF 以用于本地推理。
重要提示:
- 本检查点没有 MTP 层。
- 请将模型作为普通 Qwen 风格的因果 LM 检查点使用。
- 转换为 GGUF 时,请在使用前验证转换后的模型。
- 在假设转换正确之前,务必测试文本生成。
- 如果运行时需要 MTP 元数据,请禁用 MTP 相关假设,或使用无 MTP 配置。
转换后推荐的验证提示:
请用三段话来解释这个模型是什么。
写一个 Python 脚本,读取 JSONL 文件并检查每一行是否包含 messages 数组。
给你一个报错的 Docker Compose 文件。请逐步说明如何调试它。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#intended-use预期用途
Qwable 27B 面向研究、实验、本地推理以及助手风格的工作流。
良好的使用场景包括:
- 编码助手
- 技术写作
- 调试辅助
- 本地代理实验
- 指令遵循基准测试
- 推理风格助手回答
- 合成数据实验
未经额外评估,无法保证该模型的安全、正确或生产就绪。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#limitations局限性
与其他微调语言模型一样,Qwable 27B 可能生成不正确、不完整或具有误导性的输出。
已知局限性:
- 不是 MTP 训练模型。
- 可能继承基础模型的局限性。
- 可能反映训练数据集中的偏见或人为产物。
- 可能产生自信但错误的技术回答。
- 在安全性、拒绝行为和写作风格方面可能不同于基础模型。
- 尚未针对高利害场景进行验证。
在用于生产、安全敏感、医疗、法律、金融或安全关键环境之前,务必验证输出。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#reproducibility可复现性
训练和导出工具位于生成此检查点的 DSv4-Tune 工作流中。
微调路径使用了:
data/processed/train.jsonl
该文件包含本次运行所使用的标准化聊天格式训练样本。
建议的可复现性检查清单:
- 验证基础模型版本(revision)
- 验证分词器文件
- 验证处理后的 JSONL 数据集
- 保存训练配置
- 记录确切的导出命令
- 在转换前测试导出的检查点
- 如果发布本地构建,请单独测试转换后的 GGUF
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#naming命名
Qwable = Qwen + Fable。
该名称反映了模型的目标:将 Qwen 27B 基础与 Fable 风格的推理和助手轨迹相结合。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#license许可证
仓库元数据和训练/导出文件以 MIT 许可证发布。
底层基础模型 unsloth/Qwen3.6-27B 可能有自己的许可证条款。用户在使用、修改或重新分发此检查点之前,有责任审查并遵守基础模型许可证以及任何数据集许可证要求。
https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#disclaimer免责声明
这是一个实验性的微调模型。
仅供研究和本地实验使用。不提供任何担保。在实际部署中使用前,请仔细验证。
相似文章
@MiaAI_lab: MTP 已上线,试试吧 https://huggingface.co/Mia-AiLab/Qwable-3.6-27b-MTP…
Mia-AiLab 发布了 Qwable-3.6-27b-MTP,这是基于 Qwen3.6-27B 的完整微调检查点,使用了经过清洗的 Fable 5 推理与指令数据集,专注于代码、结构化推理以及带有 MTP 层的本地推理。
Qwen/Qwen3.6-27B-FP8
阿里巴巴发布 Qwen3.6-27B-FP8,一款 27B 参数的 FP8 量化模型,在代理式编码与推理基准上表现强劲,现已上架 Hugging Face。
Qwen/Qwen3.6-35B-A3B
Qwen 发布 Qwen3.6-35B-A3B,一款开源权重的混合专家(MoE)模型,总参数量 35B,激活参数量 3B,在智能体编码和推理能力保持方面实现显著提升。
Qwen/Qwen3.6-35B-A3B-FP8
阿里巴巴发布了Qwen3.6-35B-A3B-FP8,这是Qwen3.6的开源权重量化变体,拥有35B参数,通过MoE激活3B,具有改进的智能编码能力和保持思维链的迭代开发特性。
Qwen3.6-27B
阿里巴巴 Qwen 团队发布 270 亿参数新语言模型 Qwen3.6-27B,并公布基准测试结果。