标签
本文提出 ACSESS 方法,用于自动组合多种样本选择策略来改进少样本学习的性能,涵盖上下文学习和梯度优化两种方法。该工作在包含文本和图像两种模态的 14 个数据集上证明,策略组合的效果始终优于单个选择方法。
SCHK-HTC是一种针对少样本层级文本分类的新颖方法,它将兄弟对比学习与层级知识感知提示微调相结合,能够更好地区分层级结构中较深层次的语义相似类别。该方法在三个基准数据集上取得最先进的性能,通过增强模型对兄弟类之间细微差异的感知能力来实现。
OpenAI 推出了 GPT-3,一个拥有 1750 亿参数的自回归语言模型,它在无需梯度更新或微调的情况下,在多种 NLP 任务上展现出强大的小样本学习能力,代表了语言模型应用范式的转变——仅通过文本交互就能适应新任务。
OpenAI 推出了一个基于音速小子(Sonic the Hedgehog)的新型强化学习基准,用于测量 RL 智能体的迁移学习和小样本学习性能,同时包括基线算法的评估。
本文分析了用于少样本学习的一阶元学习算法,介绍了 Reptile 算法,并提供了对这些计算效率高的方法为何在既有基准上表现良好的理论见解。
OpenAI 推出了 Reptile,一种用于少样本分类的可扩展元学习算法,性能与 MAML 相当,但收敛速度更快、方差更低。该论文提供了理论分析,表明 Reptile 通过最大化任务梯度的内积来改进泛化性能。
RL²将快速强化学习算法编码为循环神经网络的权重,通过缓慢的通用强化学习来学习,使智能体能够像生物学习一样通过少量试验快速适应新任务。该方法在小规模老虎机问题和大规模基于视觉的导航任务上都展现了强大性能。