qlora

#qlora

@0xSero: Highly recommended educational content. LoRA is one of the coolest things to dabble in, lets anyone fine tune models re…

X AI KOLs Timeline ↗ · 昨天缓存

本文详细介绍了 LoRA 及其变体（QLoRA、VeRA、DoRA）的原理，解释了如何通过低秩分解减少可训练参数，实现高效微调大型模型。

0 人收藏 0 人点赞

#qlora

@SergioPaniego: https://x.com/SergioPaniego/status/2066498136273531363

X AI KOLs Timeline ↗ · 2026-06-15 缓存

这篇帖子演示了如何通过单个提示词免费微调模型，利用了新的Google Colab CLI以及Hugging Face的TRL和trackio工具，所有这些都由AI代理编排。

0 人收藏 0 人点赞

#qlora

用于生物医学声明验证的小型LLM：经济高效的微调、结构化数据集捷径与跨域泛化

arXiv cs.CL ↗ · 2026-06-12 缓存

使用QLoRA对小型LLM（3B-7B）进行生物医学声明验证的微调，以44.5倍更低的成本实现了比GPT-4o和GPT-5更高的F1分数，并揭示了SciFact中的一个结构伪影。该研究表明，在结构合理的数据上进行训练可实现稳健的跨域迁移。

0 人收藏 0 人点赞

#qlora

bytkim/Qwen3.6-27B-MTP-pi-tune-GGUF

Hugging Face Models Trending ↗ · 2026-06-02 缓存

bytkim 发布了 Qwen3.6-27B 的 4-bit QLoRA SFT 多令牌预测微调版本，打包为 GGUF 格式，用于本地代理编码。该无思考调优版本专为代理循环中的低延迟直接输出而设计。

0 人收藏 0 人点赞

#qlora

LinguIUTics 在 PsyDefDetect 中的方法：面向心理防御机制分类的迭代不平衡感知 Qwen3-8B 微调

arXiv cs.CL ↗ · 2026-06-02 缓存

本文提出了一种迭代不平衡感知微调方法，使用 Qwen3-8B 和 QLoRA 进行心理防御机制分类，在 PsyDefDetect 2026 共享任务中取得了 0.3917 的宏 F1 分数，在 21 支队伍中排名第 4。

0 人收藏 0 人点赞

#qlora

Qwen 3.6 27B AR->Diffusion - 在5090上的本地训练

Reddit r/LocalLLaMA ↗ · 2026-05-26

作者详细介绍了尝试在Nvidia 5090 GPU上使用qlora以及来自open-dllm和d3LLM的修改来本地训练Qwen 3.6 27B自回归到扩散模型的过程，在探索单步扩散技术时遇到了显存限制和硬件问题。

0 人收藏 0 人点赞

#qlora

@DanKornas：微调本地大语言模型不应需要租用云端GPU。Silicon Studio 是一款开源桌面应用，适用于本地大语言模型的……

X AI KOLs Following ↗ · 2026-05-21 缓存

Silicon Studio 是一款开源桌面应用，支持在 Apple Silicon Mac 上使用 MLX 进行本地大语言模型微调和推理，具备数据准备、模型管理和可视化配置等功能。

0 人收藏 0 人点赞

#qlora

HPC-LLM：面向HPC支持的实用领域自适应与检索增强生成

arXiv cs.LG ↗ · 2026-05-19 缓存

本文介绍了HPC-LLM，一个面向HPC工作流的检索增强与领域自适应助手，基于HPC文档使用QLoRA微调Llama 3.1 8B模型。实验表明，该模型在资源需求显著降低的情况下，性能与更大的通用模型相当。

0 人收藏 0 人点赞

#qlora

我训练了TIME：基于Qwen模型的短时上下文触发思考而非过度思考

Reddit r/LocalLLaMA ↗ · 2026-05-18

一个个人项目最终产出了一篇ACL 2026论文，介绍了TIME方法，训练Qwen3模型进行短时、上下文触发的思考，而非过度推理。该工作使用了QLoRA和四阶段课程，所有数据和代码均已开源发布。

0 人收藏 0 人点赞

#qlora

@_vmlops：在单GPU上微调12B模型已成现实大多数人以为需要庞大的GPU集群才能微调大型语言模型…

X AI KOLs Timeline ↗ · 2026-05-17 缓存

Hugging Face 的 PEFT 库实现了在单张 GPU 上对大型模型进行参数高效微调，在降低计算和存储成本的同时保持性能。

0 人收藏 0 人点赞

#qlora

降低学习率比任何其他尝试都更好地修复了我的Qlora微调问题

Reddit r/LocalLLaMA ↗ · 2026-05-14

一位用户发现，将学习率从2e-4降低到1e-4显著改善了Llama 3.1 8B在小型数据集（8k样本）上的QLoRA微调效果，防止了过拟合，并获得了更好的评估结果。

0 人收藏 0 人点赞

#qlora

面向南非结核病诊疗的领域专用大语言模型开发与初步评估

arXiv cs.CL ↗ · 2026-04-23 缓存

研究人员使用QLoRA与GraphRAG对BioMistral-7B进行微调，构建面向南非结核病诊疗的LLM，在上下文对齐方面优于基座模型。

0 人收藏 0 人点赞

#qlora

KyleHessling1/Qwopus-GLM-18B-Merged-GGUF

Hugging Face Models Trending ↗ · 2026-04-17 缓存

实验性 18B 参数模型：将两个 Qwen-3.5-9B 微调模型堆叠后，用 1000 步 QLoRA“缝合”层边界；生成的 GGUF 在 44 项测试集上超越 Qwen 3.6-35B MoE，却只占 9.2 GB 显存。

0 人收藏 0 人点赞

qlora

提交意见反馈