Mia-AiLab/Qwable-3.6-27b

Hugging Face Models Trending 模型

摘要

Mia-AiLab 发布了 Qwable-3.6-27b,这是一个基于清理后的推理和指令数据集对 Qwen3.6-27B 进行全参数微调的检查点,针对编程、技术辅助和结构化回复进行了优化。

Tags: transformers, gguf, qwen, qwen3, qwen3.6, fable, fable5, reasoning, finetune, instruction-tuning, code, llm, arm64, dgx-spark, base_model:unsloth/Qwen3.6-27B, base_model:quantized:unsloth/Qwen3.6-27B, license:mit, endpoints_compatible, region:us, conversational
查看原文
查看缓存全文

缓存时间: 2026/06/17 23:38

Mia-AiLab/Qwable-3.6-27b · Hugging Face

来源: https://huggingface.co/Mia-AiLab/Qwable-3.6-27b Qwable 27B

Qwable 27B 是一个完整的 Hugging Face 检查点,基于 unsloth/Qwen3.6-27B 在清洗后的 Fable 5 风格推理与指令数据集上微调而成。

该模型的目标很简单:以强大的 Qwen 27B 为基础,推动其向更清晰、结构化的轨迹式助手行为发展,特别适用于代码、技术推理和指令遵循类工作流。

这不是 LoRA 适配器。此仓库包含完整的微调模型检查点

在 X 上关注 Mia (https://x.com/MiaAI_lab)


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#highlights亮点

  • 基础模型: unsloth/Qwen3.6-27B
  • 检查点类型: 完整 HF 模型检查点
  • 训练方式: 指令微调,配合轨迹/推理风格示例
  • 数据集: 清洗后的 Fable 5 推理/指令数据集
  • 主要方向: 编码、结构化回答、技术支持、本地推理
  • MTP: 已禁用 / 本检查点中不包含
  • 本地友好目标: 设计时已考虑下游 GGUF 转换

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#model-summary模型摘要

字段
基础模型unsloth/Qwen3.6-27B
架构Qwen3_5ForConditionalGeneration
模型类型qwen3_5
检查点类型完整 HF 检查点
PEFT / LoRA
MTP 层数0
训练方式指令 + 轨迹风格微调
主要用途代码、推理、结构化助手的回答

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#what-this-model-is-good-at该模型擅长什么

Qwable 27B 面向需要模型生成更有组织性、更具思考性的回答的工作流,经过针对性的调校。

它适用于:

  • 结构化指令遵循
  • 以代码为核心的生成与编辑
  • 技术调试辅助
  • 轨迹式助手回答
  • 高强度推理提示
  • 本地模型实验
  • 下游转换为 GGUF 以在 llama.cpp、LM Studio 或其他本地运行环境中使用

此模型的风格应与基础检查点不同: 更具引导性、更偏向解释、更注重分步完成任务。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#how-to-use如何使用

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#transformersTransformers

from transformers import AutoTokenizer, Qwen3_5ForConditionalGeneration
import torch

model_id = "your-org-or-username/Qwable-27B"

tokenizer = AutoTokenizer.from_pretrained(
    model_id,
    trust_remote_code=True,
)

model = Qwen3_5ForConditionalGeneration.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
)

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#simple-generation-example简单生成示例

messages = [
    {
        "role": "user",
        "content": "写一个 Python 函数,用于验证聊天消息的 JSONL 训练文件。"
    }
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
)

inputs = tokenizer(text, return_tensors="pt").to(model.device)

outputs = model.generate(
    **inputs,
    max_new_tokens=1024,
    temperature=0.6,
    top_p=0.95,
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#gguf–local-inference-notesGGUF / 本地推理注意事项

此检查点旨在转换为 GGUF 以用于本地推理。

重要提示:

  • 本检查点没有 MTP 层
  • 请将模型作为普通 Qwen 风格的因果 LM 检查点使用。
  • 转换为 GGUF 时,请在使用前验证转换后的模型。
  • 在假设转换正确之前,务必测试文本生成。
  • 如果运行时需要 MTP 元数据,请禁用 MTP 相关假设,或使用无 MTP 配置。

转换后推荐的验证提示:

请用三段话来解释这个模型是什么。
写一个 Python 脚本,读取 JSONL 文件并检查每一行是否包含 messages 数组。
给你一个报错的 Docker Compose 文件。请逐步说明如何调试它。

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#intended-use预期用途

Qwable 27B 面向研究、实验、本地推理以及助手风格的工作流。

良好的使用场景包括:

  • 编码助手
  • 技术写作
  • 调试辅助
  • 本地代理实验
  • 指令遵循基准测试
  • 推理风格助手回答
  • 合成数据实验

未经额外评估,无法保证该模型的安全、正确或生产就绪。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#limitations局限性

与其他微调语言模型一样,Qwable 27B 可能生成不正确、不完整或具有误导性的输出。

已知局限性:

  • 不是 MTP 训练模型。
  • 可能继承基础模型的局限性。
  • 可能反映训练数据集中的偏见或人为产物。
  • 可能产生自信但错误的技术回答。
  • 在安全性、拒绝行为和写作风格方面可能不同于基础模型。
  • 尚未针对高利害场景进行验证。

在用于生产、安全敏感、医疗、法律、金融或安全关键环境之前,务必验证输出。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#reproducibility可复现性

训练和导出工具位于生成此检查点的 DSv4-Tune 工作流中。

微调路径使用了:

data/processed/train.jsonl

该文件包含本次运行所使用的标准化聊天格式训练样本。

建议的可复现性检查清单:

  • 验证基础模型版本(revision)
  • 验证分词器文件
  • 验证处理后的 JSONL 数据集
  • 保存训练配置
  • 记录确切的导出命令
  • 在转换前测试导出的检查点
  • 如果发布本地构建,请单独测试转换后的 GGUF

https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#naming命名

Qwable = Qwen + Fable。

该名称反映了模型的目标:将 Qwen 27B 基础与 Fable 风格的推理和助手轨迹相结合。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#license许可证

仓库元数据和训练/导出文件以 MIT 许可证发布。

底层基础模型 unsloth/Qwen3.6-27B 可能有自己的许可证条款。用户在使用、修改或重新分发此检查点之前,有责任审查并遵守基础模型许可证以及任何数据集许可证要求。


https://huggingface.co/Mia-AiLab/Qwable-3.6-27b#disclaimer免责声明

这是一个实验性的微调模型。

仅供研究和本地实验使用。不提供任何担保。在实际部署中使用前,请仔细验证。

相似文章

Qwen/Qwen3.6-27B-FP8

Hugging Face Models Trending

阿里巴巴发布 Qwen3.6-27B-FP8,一款 27B 参数的 FP8 量化模型,在代理式编码与推理基准上表现强劲,现已上架 Hugging Face。

Qwen/Qwen3.6-35B-A3B

Hugging Face Models Trending

Qwen 发布 Qwen3.6-35B-A3B,一款开源权重的混合专家(MoE)模型,总参数量 35B,激活参数量 3B,在智能体编码和推理能力保持方面实现显著提升。

Qwen/Qwen3.6-35B-A3B-FP8

Hugging Face Models Trending

阿里巴巴发布了Qwen3.6-35B-A3B-FP8,这是Qwen3.6的开源权重量化变体,拥有35B参数,通过MoE激活3B,具有改进的智能编码能力和保持思维链的迭代开发特性。

Qwen3.6-27B

Reddit r/LocalLLaMA

阿里巴巴 Qwen 团队发布 270 亿参数新语言模型 Qwen3.6-27B,并公布基准测试结果。