标签
本文表明,在低资源验证场景中,验证者仅能访问目标分布中碎片化且有偏的片段,此时数据选择会通过剪除全局相关的尾部模式,反而加速模型崩溃。作者提供了理论证明,并提出了一种协作代理参考机制作为缓解策略。