标签
本文介绍了 LANTERN,这是一个用于强化学习中多源神经符号迁移的框架,它利用大语言模型生成任务自动机,并结合自适应门控机制来提高样本效率。
明尼苏达大学德卢斯分校团队利用 Gemini 3 与 Claude Sonnet 4.5 生成的合成数据增强 DeBERTa-V3-base,对政治问题避答进行分类,在 SemEval-2026 任务 6 中排名第 8。