标签
本文提出了一种面向扩散模型的类频率引导噪声调度,为低频类别分配更大尺度的噪声,以改善在不平衡数据集上的生成质量,相较于基线方法取得了显著提升。
在一条推文中,Sarah Hooker 指出 GPU 并不适合现实世界数据的长尾分布,并建议需要替代性 AI 硬件。
本文介绍了一种分布感知的强化学习框架,该框架利用基于批级比较的监督信号,提升了多模态大语言模型在长尾数值回归任务中的性能。