joint-training

标签

Cards List
#joint-training

Chronicle:用于联合语言和时间序列理解的多模态基础模型

arXiv cs.LG · 2026-05-21 缓存

Chronicle 是一个 324M 参数的纯解码器 Transformer,从零开始在自然语言和时间序列上预训练,在 NLU 和时间序列分类任务上取得了有竞争力的性能,并在 UCR/UEA 数据集上的冻结嵌入时间序列分类中创造了新的最先进水平。

0 人收藏 0 人点赞
#joint-training

ICRL:通过强化学习内化自我批判

arXiv cs.AI · 2026-05-18 缓存

本文介绍了ICRL框架,该框架联合训练求解器和批判器,通过强化学习内化批判指导,使求解器无需外部批判即可自我改进。它使用分布校准和角色分组优势估计,在智能体和数学推理任务上比GRPO提高了6-7个点。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈