meta-learning

标签

Cards List
#meta-learning

弱链优化:多智能体推理与协作框架

arXiv cs.CL · 2026-04-20 缓存

本论文提出WORC框架,这是一个针对多智能体LLM系统的弱链优化框架,通过基于元学习的权重预测和不确定性驱动的资源分配来识别并强化表现不佳的智能体,在推理基准上达到82.2%的准确率,同时提升了系统稳定性。

0 人收藏 0 人点赞
#meta-learning

元学习上下文学习实现无需训练的跨被试脑解码

Hugging Face Daily Papers · 2026-04-09 缓存

# 论文页面 - 元学习上下文学习实现无需训练的跨被试脑解码 来源:[https://huggingface.co/papers/2604.08537](https://huggingface.co/papers/2604.08537) 作者:,,,,,,,,,,,,, ## 摘要 一种元优化方法通过少量图像-脑示例快速推断个体独特神经编码模式,无需跨被试及扫描仪微调,即可实现可泛化的语义视觉解码。[视觉解码](https://huggingface.co/papers?q

0 人收藏 0 人点赞
#meta-learning

进化策略梯度

OpenAI Blog · 2018-04-18 缓存

OpenAI 推出进化策略梯度(EPG),这是一种元学习方法,通过进化而非直接学习策略来学习损失函数,使强化学习代理能够通过利用类似人类技能迁移的先验经验,更好地跨任务泛化。

0 人收藏 0 人点赞
#meta-learning

关于一阶元学习算法

OpenAI Blog · 2018-03-08 缓存

本文分析了用于少样本学习的一阶元学习算法,介绍了 Reptile 算法,并提供了对这些计算效率高的方法为何在既有基准上表现良好的理论见解。

0 人收藏 0 人点赞
#meta-learning

Reptile:可扩展的元学习算法

OpenAI Blog · 2018-03-07 缓存

OpenAI 推出了 Reptile,一种用于少样本分类的可扩展元学习算法,性能与 MAML 相当,但收敛速度更快、方差更低。该论文提供了理论分析,表明 Reptile 通过最大化任务梯度的内积来改进泛化性能。

0 人收藏 0 人点赞
#meta-learning

用于摔跤的元学习

OpenAI Blog · 2017-10-11 缓存

OpenAI 研究人员开发了元学习智能体,能够在多轮竞争性游戏中持续调整其策略,相比固定策略智能体展现出优异性能,并对环境和身体变化具有鲁棒性。

0 人收藏 0 人点赞
#meta-learning

单次模仿学习

OpenAI Blog · 2017-03-21 缓存

OpenAI 提出了一个元学习框架,用于单次模仿学习,使机器人能够从单个演示中学习新任务,并泛化到新实例而无需任务特定的工程设计。该方法使用软注意力机制,使在多样化任务对上训练的神经网络能够在测试时对看不见的任务表现良好。

0 人收藏 0 人点赞
#meta-learning

RL²:通过缓慢强化学习实现快速强化学习

OpenAI Blog · 2016-11-09 缓存

RL²将快速强化学习算法编码为循环神经网络的权重,通过缓慢的通用强化学习来学习,使智能体能够像生物学习一样通过少量试验快速适应新任务。该方法在小规模老虎机问题和大规模基于视觉的导航任务上都展现了强大性能。

0 人收藏 0 人点赞
← Previous
← 返回首页

提交意见反馈