meta-learning

#meta-learning

从多个稀疏数据集中学习动力系统：一种分层贝叶斯建模方法

arXiv cs.LG ↗ · 3小时前缓存

提出了一种分层贝叶斯框架，用于从多个稀疏、含噪声的数据集中对动力系统进行元学习，利用基于梯度的MCMC与嵌入的ODE求解器，对共享参数和数据集特定参数进行高效的后验推断。

0 人收藏 0 人点赞

#meta-learning

探索双元元学习以增强开放集场景下的域泛化

arXiv cs.LG ↗ · 昨天缓存

提出了一种名为MEDIC的新型元学习策略，用于开放集域泛化，该策略通过域和类别划分间的隐式梯度匹配来实现更优的边界。实验表明其性能达到最先进水平。

0 人收藏 0 人点赞

#meta-learning

Connect the Dots：通过强化学习训练LLM以具备跨域泛化能力的长期生命周期智能体

Hugging Face Daily Papers ↗ · 2026-06-18 缓存

本文介绍了Connect the Dots（CoD），这是一个通过强化学习训练LLM的框架，用于培养长期生命周期智能体的元能力，实现持续学习和跨域泛化。

0 人收藏 0 人点赞

#meta-learning

可检索梯度：无累积权重漂移的持续后训练

arXiv cs.CL ↗ · 2026-06-16 缓存

提出 ReGrad，一种将梯度视为可检索知识单元用于持续后训练的范式，通过将文档特定梯度存储在梯度银行（Gradient Bank）中，并在推理时检索查询相关梯度进行临时权重适应，从而避免累积权重漂移。

0 人收藏 0 人点赞

#meta-learning

Fodor和Pylyshyn的系统性挑战仍然存在

arXiv cs.CL ↗ · 2026-06-15 缓存

本文认为，最近声称神经网络已解决Fodor和Pylyshyn的系统性挑战的结论为时过早。作者表明，用于组合性的元学习模型在分布外泛化方面失败，甚至在分布内问题上也表现出非系统性行为，从而得出结论：该挑战仍未解决。

0 人收藏 0 人点赞

#meta-learning

基于权重空间元学习的机器人策略自适应

Hugging Face Daily Papers ↗ · 2026-06-05 缓存

提出WIZARD，一种权重空间元学习框架，它从语言指令和演示视频中为冻结的VLA策略生成任务特定的LoRA参数，从而实现无需微调的高效任务自适应。

0 人收藏 0 人点赞

#meta-learning

离线选择器为何无法胜过最佳单一模型：基于edX辍学预测的诊断性研究

arXiv cs.LG ↗ · 2026-06-04 缓存

本文提出了一个三阶段诊断框架，用于识别离线模型选择器为何无法胜过最佳单一模型，并将其应用于edX点击流数据上的辍学预测。研究发现瓶颈在于局部表征歧义，而非学习器选择或分布偏移，建议重新设计状态或收集新数据，而非进一步调优算法。

0 人收藏 0 人点赞

#meta-learning

SePO：用于系统提示优化的自进化提示智能体

arXiv cs.CL ↗ · 2026-06-04 缓存

SePO（自进化提示优化）提出了一种自指涉提示智能体，通过进化搜索同时优化任务智能体的系统提示和自身的系统提示。在包括 AIME'25、ARC-AGI-1 和 GPQA 在内的五个基准测试中，SePO 的表现优于 Manual-CoT、TextGrad 和 MetaSPO。

0 人收藏 0 人点赞

#meta-learning

R-APS：通过反思性对抗帕累托搜索实现约束设计的组合推理与上下文元学习

arXiv cs.AI ↗ · 2026-06-04 缓存

R-APS（反思性对抗帕累托搜索）是一种面向约束设计任务的新方法，通过跨三个时间尺度的推理模式分解，解决了基于LLM的智能体系统中的三类结构性缺陷——错误传播、鲁棒性评估与知识失效，且无需微调。在平面机构综合任务上的评估结果表明，与基线方法相比，R-APS实现了3.5倍更紧的鲁棒性证书、46%更快的首次准入迭代速度，以及2.1倍的Chamfer距离缩减。

0 人收藏 0 人点赞

#meta-learning