meta-learning

标签

Cards List
#meta-learning

从多个稀疏数据集中学习动力系统:一种分层贝叶斯建模方法

arXiv cs.LG · 3小时前 缓存

提出了一种分层贝叶斯框架,用于从多个稀疏、含噪声的数据集中对动力系统进行元学习,利用基于梯度的MCMC与嵌入的ODE求解器,对共享参数和数据集特定参数进行高效的后验推断。

0 人收藏 0 人点赞
#meta-learning

探索双元元学习以增强开放集场景下的域泛化

arXiv cs.LG · 昨天 缓存

提出了一种名为MEDIC的新型元学习策略,用于开放集域泛化,该策略通过域和类别划分间的隐式梯度匹配来实现更优的边界。实验表明其性能达到最先进水平。

0 人收藏 0 人点赞
#meta-learning

Connect the Dots:通过强化学习训练LLM以具备跨域泛化能力的长期生命周期智能体

Hugging Face Daily Papers · 2026-06-18 缓存

本文介绍了Connect the Dots(CoD),这是一个通过强化学习训练LLM的框架,用于培养长期生命周期智能体的元能力,实现持续学习和跨域泛化。

0 人收藏 0 人点赞
#meta-learning

可检索梯度:无累积权重漂移的持续后训练

arXiv cs.CL · 2026-06-16 缓存

提出 ReGrad,一种将梯度视为可检索知识单元用于持续后训练的范式,通过将文档特定梯度存储在梯度银行(Gradient Bank)中,并在推理时检索查询相关梯度进行临时权重适应,从而避免累积权重漂移。

0 人收藏 0 人点赞
#meta-learning

Fodor和Pylyshyn的系统性挑战仍然存在

arXiv cs.CL · 2026-06-15 缓存

本文认为,最近声称神经网络已解决Fodor和Pylyshyn的系统性挑战的结论为时过早。作者表明,用于组合性的元学习模型在分布外泛化方面失败,甚至在分布内问题上也表现出非系统性行为,从而得出结论:该挑战仍未解决。

0 人收藏 0 人点赞
#meta-learning

基于权重空间元学习的机器人策略自适应

Hugging Face Daily Papers · 2026-06-05 缓存

提出WIZARD,一种权重空间元学习框架,它从语言指令和演示视频中为冻结的VLA策略生成任务特定的LoRA参数,从而实现无需微调的高效任务自适应。

0 人收藏 0 人点赞
#meta-learning

离线选择器为何无法胜过最佳单一模型:基于edX辍学预测的诊断性研究

arXiv cs.LG · 2026-06-04 缓存

本文提出了一个三阶段诊断框架,用于识别离线模型选择器为何无法胜过最佳单一模型,并将其应用于edX点击流数据上的辍学预测。研究发现瓶颈在于局部表征歧义,而非学习器选择或分布偏移,建议重新设计状态或收集新数据,而非进一步调优算法。

0 人收藏 0 人点赞
#meta-learning

SePO:用于系统提示优化的自进化提示智能体

arXiv cs.CL · 2026-06-04 缓存

SePO(自进化提示优化)提出了一种自指涉提示智能体,通过进化搜索同时优化任务智能体的系统提示和自身的系统提示。在包括 AIME'25、ARC-AGI-1 和 GPQA 在内的五个基准测试中,SePO 的表现优于 Manual-CoT、TextGrad 和 MetaSPO。

0 人收藏 0 人点赞
#meta-learning

R-APS:通过反思性对抗帕累托搜索实现约束设计的组合推理与上下文元学习

arXiv cs.AI · 2026-06-04 缓存

R-APS(反思性对抗帕累托搜索)是一种面向约束设计任务的新方法,通过跨三个时间尺度的推理模式分解,解决了基于LLM的智能体系统中的三类结构性缺陷——错误传播、鲁棒性评估与知识失效,且无需微调。在平面机构综合任务上的评估结果表明,与基线方法相比,R-APS实现了3.5倍更紧的鲁棒性证书、46%更快的首次准入迭代速度,以及2.1倍的Chamfer距离缩减。

0 人收藏 0 人点赞
#meta-learning

CHAM-net:一种对比分层自适应元网络,用于稳健的全球甲烷通量预测

arXiv cs.LG · 2026-06-02 缓存

CHAM-net提出了一种对比分层自适应元网络,能够捕捉站点特定和跨年动态,用于稳健的全球甲烷通量预测,在模拟和观测数据集上均优于基线方法。

0 人收藏 0 人点赞
#meta-learning

模型遗忘目标因语言功能不同而异

arXiv cs.CL · 2026-05-27 缓存

本文认为,LLM中的遗忘应依赖于目标,提出了一种基于余弦的元学习RMU变体用于危险知识遗忘,以及一种结合探针方向的多层目标用于毒性遗忘,在四个7-8B模型上取得了显著效果。

0 人收藏 0 人点赞
#meta-learning

刻画神经过程的表征能力

arXiv cs.LG · 2026-05-26 缓存

本文从理论上刻画了神经过程(NP)架构的表征能力,证明了条件NP、注意力NP、卷积NP和Transformer NP之间存在严格的层级关系,并表明有限维潜变量不会将表征能力扩展到编码器之外。

0 人收藏 0 人点赞
#meta-learning

神经过程摊销高斯过程推理的三个代价

arXiv cs.LG · 2026-05-22 缓存

本文将对高斯过程和潜在神经过程后验之间的预测KL散度分解为三项,提供了刻画近似误差的上界,并将表示维度与核平滑度联系起来。

0 人收藏 0 人点赞
#meta-learning

SOLAR: 一种自我优化的开放式自主代理,用于终身学习与持续适应

arXiv cs.AI · 2026-05-22 缓存

SOLAR提出了一种自我优化的自主代理,利用参数级元学习和多层次强化学习,使LLMs能够对非平稳数据流进行终身适应,在推理任务上超越基线。

0 人收藏 0 人点赞
#meta-learning

@arcprize: Jerry Tworek谈通往AGI之路 @MillionInt与@FrancoisChauba1坐下来讨论AGI之路的下一步 0:…

X AI KOLs Following · 2026-05-13 缓存

Jerry Tworek和François Chollet讨论通往AGI之路,涵盖智能的定义、游戏的作用以及为什么元学习是最接近的方法。

0 人收藏 0 人点赞
#meta-learning

NoiseRater:用于扩散模型训练的元学习噪声评估

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 NoiseRater,这是一种元学习框架,在扩散模型训练期间为各个噪声样本分配重要性评分,以提高训练效率和生成质量。

0 人收藏 0 人点赞
#meta-learning

RubricEM:基于量规引导策略分解,超越可验证奖励的元强化学习

Hugging Face Daily Papers · 2026-05-11 缓存

本文介绍了 RubricEM,这是一个强化学习框架,它利用量规引导的策略分解和基于反思的元策略进化,为长篇任务训练深度研究智能体。所得到的 RubricEM-8B 模型通过利用阶段感知规划和更密集的语义反馈,在长篇研究基准测试中表现出强劲的性能。

0 人收藏 0 人点赞
#meta-learning

面向类别不平衡的模型无关元学习适应方法

arXiv cs.CL · 2026-04-22 缓存

孟菲斯大学研究团队提出 HAMR——一种模型无关的元学习框架,通过双层优化与邻域感知重采样,在六个不平衡 NLP 数据集上自适应地为困难样本与少数类重新赋权。

0 人收藏 0 人点赞
#meta-learning

FSPO:少样本合成偏好优化实现面向真实用户的个性化

arXiv cs.CL · 2026-04-20 缓存

FSPO提出了一种用于大语言模型个性化的少样本偏好优化算法,该算法将奖励建模重新定义为元学习,使模型能够从有限的用户偏好中快速推断出个性化的奖励函数。该方法通过精心构建合成偏好数据集,在合成用户上实现了87%的个性化性能,在真实用户上实现了70%的个性化性能。

0 人收藏 0 人点赞
#meta-learning

少样本学习中样本选择策略的自动组合

arXiv cs.CL · 2026-04-20 缓存

本文提出 ACSESS 方法,用于自动组合多种样本选择策略来改进少样本学习的性能,涵盖上下文学习和梯度优化两种方法。该工作在包含文本和图像两种模态的 14 个数据集上证明,策略组合的效果始终优于单个选择方法。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈