non-stationary-environments

标签

Cards List
#non-stationary-environments

利用快慢后继特征平衡可塑性与稳定性

arXiv cs.LG · 2026-05-27 缓存

本文研究了渐变非平稳环境下强化学习中的稳定性-可塑性困境,发现通过跨多个时间尺度的突触巩固来稳定后继特征,其效果优于专注于可塑性的方法。

0 人收藏 0 人点赞
#non-stationary-environments

将漂移转化为约束:非平稳环境下的鲁棒推理对齐

Hugging Face Daily Papers · 2026-05-02 缓存

本文引入了 CXR-MAX,这是一个大规模基准,旨在利用来自多个多模态大语言模型(MLLM)的 X 射线数据,评估非平稳环境下的推理对齐性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈