alignment-pipeline

#alignment-pipeline

从上下文偏移到风格崩塌：为什么训练目标比规模更重要

arXiv cs.CL ↗ · 6天前缓存

本文研究训练对齐目标如何重塑大型语言模型的语言特征，发现指令微调系统坍塌语言熵的程度显著超过规模预期，并且熵正则化可以缓解这种坍塌。

0 人收藏 0 人点赞

#alignment-pipeline

arXiv cs.CL ↗ · 2026-05-27 缓存

本综述将大型语言模型的对齐微调重新表述为一个数据流水线设计问题，将其分解为三个环节：响应合成、偏好评估和偏好实例化。它识别了设计权衡和失败模式，并概述了开放挑战，如提示级对齐和智能体设置。

0 人收藏 0 人点赞