标签
本文表明,像Forward-Forward (FF)这样的层局部训练方法无法扩展到真实的图像尺寸和数据集,且合成基准测试夸大了其性能。作者引入了一个强大的FF变体(DTG-FF),并证明在真实数据(例如224x224的ImageNet-100)上,FF仅达到49.4%,而典型BP超过75%,而在合成任务上,差距缩小甚至反转。