@bradenjhancock: 换句话说:人类正在教教师模型如何像优秀的人类教师教其他人那样教其他模…

X AI KOLs Following 论文

摘要

人类正在训练教师模型,使其以循序渐进的方式教学生模型,并对跳跃式教学进行惩罚,从而提高模型的智能。

换句话说:人类正在教教师模型如何像优秀的人类教师教其他人那样教其他模型,这样我们就可以制造出更聪明的模型,进而教人类变得更聪明。直觉:一个好的教师模型不仅会引导出正确的答案——它还会按照学生可以遵循的一系列步骤来做。教师模型会因做出突兀的跳跃而受到惩罚。来自@lateinteraction的CSAIL实验室的更多酷炫工作!
查看原文

相似文章

可解释的教学示例

OpenAI Blog

研究表明,通过迭代训练师生神经网络,教师能学到可解释的教学策略,即选择或生成人类能够理解和有效学习的教学示例。