标签
本文提出了一种用于仅前向卷积神经网络的可学习通道-类别分配机制,结合了熵和正交正则化以及损失感知的层级贡献策略。该方法在CIFAR-10、CIFAR-100和Tiny-ImageNet上实现了前向-前向算法中的最先进性能,显著缩小了与反向传播的差距。
# 量化强化学习中的泛化能力 来源: [https://openai.com/index/quantifying-generalization-in-reinforcement-learning/](https://openai.com/index/quantifying-generalization-in-reinforcement-learning/) 我们训练了9个智能体来玩CoinRun,每个智能体都有不同数量的可用训练关卡。前8个智能体分别在包含100到16,000个关卡的数据集上进行训练。最后一个智能体在不受限制的关卡集合上进行训练,因此该智能体永远不会看到相同的关卡两次。