qlora

标签

Cards List
#qlora

@0xSero: Highly recommended educational content. LoRA is one of the coolest things to dabble in, lets anyone fine tune models re…

X AI KOLs Timeline · 昨天 缓存

本文详细介绍了 LoRA 及其变体(QLoRA、VeRA、DoRA)的原理,解释了如何通过低秩分解减少可训练参数,实现高效微调大型模型。

0 人收藏 0 人点赞
#qlora

@SergioPaniego: https://x.com/SergioPaniego/status/2066498136273531363

X AI KOLs Timeline · 2026-06-15 缓存

这篇帖子演示了如何通过单个提示词免费微调模型,利用了新的Google Colab CLI以及Hugging Face的TRL和trackio工具,所有这些都由AI代理编排。

0 人收藏 0 人点赞
#qlora

用于生物医学声明验证的小型LLM:经济高效的微调、结构化数据集捷径与跨域泛化

arXiv cs.CL · 2026-06-12 缓存

使用QLoRA对小型LLM(3B-7B)进行生物医学声明验证的微调,以44.5倍更低的成本实现了比GPT-4o和GPT-5更高的F1分数,并揭示了SciFact中的一个结构伪影。该研究表明,在结构合理的数据上进行训练可实现稳健的跨域迁移。

0 人收藏 0 人点赞
#qlora

bytkim/Qwen3.6-27B-MTP-pi-tune-GGUF

Hugging Face Models Trending · 2026-06-02 缓存

bytkim 发布了 Qwen3.6-27B 的 4-bit QLoRA SFT 多令牌预测微调版本,打包为 GGUF 格式,用于本地代理编码。该无思考调优版本专为代理循环中的低延迟直接输出而设计。

0 人收藏 0 人点赞
#qlora

LinguIUTics 在 PsyDefDetect 中的方法:面向心理防御机制分类的迭代不平衡感知 Qwen3-8B 微调

arXiv cs.CL · 2026-06-02 缓存

本文提出了一种迭代不平衡感知微调方法,使用 Qwen3-8B 和 QLoRA 进行心理防御机制分类,在 PsyDefDetect 2026 共享任务中取得了 0.3917 的宏 F1 分数,在 21 支队伍中排名第 4。

0 人收藏 0 人点赞
#qlora

Qwen 3.6 27B AR->Diffusion - 在5090上的本地训练

Reddit r/LocalLLaMA · 2026-05-26

作者详细介绍了尝试在Nvidia 5090 GPU上使用qlora以及来自open-dllm和d3LLM的修改来本地训练Qwen 3.6 27B自回归到扩散模型的过程,在探索单步扩散技术时遇到了显存限制和硬件问题。

0 人收藏 0 人点赞
#qlora

@DanKornas:微调本地大语言模型不应需要租用云端GPU。Silicon Studio 是一款开源桌面应用,适用于本地大语言模型的……

X AI KOLs Following · 2026-05-21 缓存

Silicon Studio 是一款开源桌面应用,支持在 Apple Silicon Mac 上使用 MLX 进行本地大语言模型微调和推理,具备数据准备、模型管理和可视化配置等功能。

0 人收藏 0 人点赞
#qlora

HPC-LLM:面向HPC支持的实用领域自适应与检索增强生成

arXiv cs.LG · 2026-05-19 缓存

本文介绍了HPC-LLM,一个面向HPC工作流的检索增强与领域自适应助手,基于HPC文档使用QLoRA微调Llama 3.1 8B模型。实验表明,该模型在资源需求显著降低的情况下,性能与更大的通用模型相当。

0 人收藏 0 人点赞
#qlora

我训练了TIME:基于Qwen模型的短时上下文触发思考而非过度思考

Reddit r/LocalLLaMA · 2026-05-18

一个个人项目最终产出了一篇ACL 2026论文,介绍了TIME方法,训练Qwen3模型进行短时、上下文触发的思考,而非过度推理。该工作使用了QLoRA和四阶段课程,所有数据和代码均已开源发布。

0 人收藏 0 人点赞
#qlora

@_vmlops:在单GPU上微调12B模型已成现实 大多数人以为需要庞大的GPU集群才能微调大型语言模型…

X AI KOLs Timeline · 2026-05-17 缓存

Hugging Face 的 PEFT 库实现了在单张 GPU 上对大型模型进行参数高效微调,在降低计算和存储成本的同时保持性能。

0 人收藏 0 人点赞
#qlora

降低学习率比任何其他尝试都更好地修复了我的Qlora微调问题

Reddit r/LocalLLaMA · 2026-05-14

一位用户发现,将学习率从2e-4降低到1e-4显著改善了Llama 3.1 8B在小型数据集(8k样本)上的QLoRA微调效果,防止了过拟合,并获得了更好的评估结果。

0 人收藏 0 人点赞
#qlora

面向南非结核病诊疗的领域专用大语言模型开发与初步评估

arXiv cs.CL · 2026-04-23 缓存

研究人员使用QLoRA与GraphRAG对BioMistral-7B进行微调,构建面向南非结核病诊疗的LLM,在上下文对齐方面优于基座模型。

0 人收藏 0 人点赞
#qlora

KyleHessling1/Qwopus-GLM-18B-Merged-GGUF

Hugging Face Models Trending · 2026-04-17 缓存

实验性 18B 参数模型:将两个 Qwen-3.5-9B 微调模型堆叠后,用 1000 步 QLoRA“缝合”层边界;生成的 GGUF 在 44 项测试集上超越 Qwen 3.6-35B MoE,却只占 9.2 GB 显存。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈