post-hoc-repair

标签

Cards List
#post-hoc-repair

面向危害感知的LLM数学推理事后替换的受保护修复方法

arXiv cs.CL · 2026-05-26 缓存

提出了一种名为GuardedRepair的框架,用于对LLM数学推理进行事后替换,通过选择性替换和安全防护来修复错误,同时最小化对正确推理轨迹的损害。在GSM8K上,该方法在未破坏正确答案的情况下,将准确率从95.60%提升至96.89%。

0 人收藏 0 人点赞
#post-hoc-repair

谱遗忘恢复:无需重新训练即可事后恢复受损能力

arXiv cs.LG · 2026-05-21 缓存

本文提出DG-Hard,一种事后谱修复方法,仅使用预训练和微调检查点,即可恢复因微调而受损的能力,无需重新训练。该方法将Donoho-Gavish硬奇异值阈值应用于权重更新,去除噪声并恢复退化的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈