finetuning

#finetuning

通过机械可解释性分析微调LLM中的道德偏见

arXiv cs.CL ↗ · 3天前缓存

本文研究微调后的LLM是否会出现Knobe效应（一种意图判断中的道德偏见），并采用层级补丁分析将该偏见定位到特定层，证明无需重新训练即可通过定向干预消除该效应。

0 人收藏 0 人点赞

#finetuning

自我改进往往是突发的：大规模模型的Enlightenment式微调

arXiv cs.LG ↗ · 2026-07-16 缓存

本文介绍了Enlightenment，一种针对大规模模型的无需训练的后调整方法，它修改关键模块中的快捷连接而不更新权重，实现了突发的能力提升。通过注意力头混合和标量调制的残差连接，该方法在LLMs和VLMs上展示了有效性。

0 人收藏 0 人点赞

#finetuning

Cseti/LTX2.3-22B_IC-LoRA-CrossView-Prompt

Hugging Face Models Trending ↗ · 2026-07-11 缓存

一个用于LTX-Video 2.3的概念验证型上下文LoRA适配器，能够通过固定词汇提示从新相机视角重新渲染视频场景，基于合成多视角数据训练而成。

0 人收藏 0 人点赞

#finetuning

对 Bloom 的怀旧

Reddit r/LocalLLaMA ↗ · 2026-07-10 缓存

BLOOMZ 和 mT0 是在跨语言任务混合 xP3 上微调的多语言模型，能够在数十种语言中实现零样本指令遵循。

0 人收藏 0 人点赞

#finetuning

Contrastive Decoding Diffing (CDD): 仅通过logits恢复逐字微调数据，无需权重访问[R]

Reddit r/MachineLearning ↗ · 2026-07-03

本文介绍了对比解码差异法（CDD），该方法仅通过logits访问即可从LLM中恢复逐字微调数据，无需模型权重或激活。它在多个模型系列中展示了高水平的逐字恢复能力，并揭示了意外数据泄露，例如来自合成训练数据的反复出现的虚构角色'Dr. Elena Rodriguez'。

0 人收藏 0 人点赞

#finetuning

自我识别微调可以预防和逆转涌现性对齐失调

arXiv cs.CL ↗ · 2026-06-24 缓存

本文提出自我识别微调作为一种干预措施，用于预防和逆转大语言模型中的涌现性对齐失调，表明它稳定了模型的对齐特征，而非采用失调的角色。

0 人收藏 0 人点赞

#finetuning

面向ReRAM的模型微调：解决I-V非线性和保持误差问题

arXiv cs.LG ↗ · 2026-06-17 缓存

提出了一种基于微调的硬件感知训练算法，以减轻ReRAM交叉阵列中的I-V非线性和保持误差，从而以最小开销实现鲁棒的DNN部署。在图像分类和问答任务上进行了评估，达到了接近基线的准确率。

0 人收藏 0 人点赞

#finetuning

Cleo: 尝试在2B模型中拟合完整的分析师行为 [P]

Reddit r/MachineLearning ↗ · 2026-06-15

Cleo 是 Qwen3.5-2B-Base 的微调版本，专为Text-to-SQL任务设计，使用统一的训练和推理框架，支持实时执行证据和安全检查。所有代码、模型和数据集均为开源。

0 人收藏 0 人点赞

#finetuning

Muon$^p$: 分数谱幂的Muon优化器

arXiv cs.LG ↗ · 2026-06-15 缓存

本文介绍了Muon^p，一种新颖的优化器，采用分数谱幂更新在Muon和梯度下降之间进行插值，提供了理论证明并在十亿参数规模的微调任务上取得了实证收益。

0 人收藏 0 人点赞

#finetuning

基于预训练语言模型的模块化单语言适配

arXiv cs.CL ↗ · 2026-06-08 缓存

本文提出了一种模块化方法，通过冻结嵌入并调整模型其余部分，将预训练语言模型适配到低资源语言，在苏格兰盖尔语、爱尔兰语和克丘亚语的NLU任务上展示了改进效果。

0 人收藏 0 人点赞

#finetuning

@adithya_s_k: 你现在可以直接用 TRL 对模型在智能体轨迹上进行微调：Claude Code 轨迹、Codex 轨迹、OpenClaw 轨迹、Pi 轨迹……

X AI KOLs Following ↗ · 2026-06-04 缓存

TRL 现在支持对来自各种来源（如 Claude Code、Codex、OpenClaw 和 Pi）的智能体轨迹进行模型微调，这正朝着训练智能体模型的标准化栈迈进。

0 人收藏 0 人点赞

#finetuning

GGT-100K：可泛化真实图像修复的生成式真实标注

Hugging Face Daily Papers ↗ · 2026-05-29 缓存

本文介绍了GGT-100K，一个包含103,707对图像的真实图像修复数据集，通过使用如Nano-Banana-2等多模态基础模型，从低质量输入生成高质量目标。实验表明，该数据集提升了多种图像修复模型的泛化能力。

0 人收藏 0 人点赞

#finetuning

无需代码的LLM微调

Reddit r/AI_Agents ↗ · 2026-05-19

本文讨论如何让非编程人员也能进行LLM微调，重点展示了一段视频演示，说明任何人都可以在无需编码的情况下定制LLM。

0 人收藏 0 人点赞

finetuning

提交意见反馈