self-supervised

标签

Cards List
#self-supervised

MemTrain:自监督上下文记忆训练

arXiv cs.CL · 昨天 缓存

MemTrain 提出了一种自监督训练框架,通过在维基百科语料上使用掩码重建和中间记忆召回代理任务,增强 LLM 智能体的上下文记忆能力,在下游记忆密集型 QA 基准上取得了高达 17.67 个百分点的提升。

0 人收藏 0 人点赞
#self-supervised

MindZero:零标注下的在线心智推理学习

arXiv cs.AI · 2天前 缓存

MindZero 提出了一种自监督强化学习框架,用于训练多模态大语言模型,使其能够高效且鲁棒地进行在线心智推理,而无需心智状态标注,在准确性和效率上均优于基于模型的方法。

0 人收藏 0 人点赞
#self-supervised

RayDer:从真实世界视频中实现可扩展的自监督新颖视图合成

Hugging Face Daily Papers · 6天前 缓存

RayDer 是一个统一的前馈变换器,它将相机估计、场景重建和渲染整合到单一架构中,用于从真实世界视频进行自监督的新颖视图合成,实现了清晰的幂律扩展和强大的零样本性能。

0 人收藏 0 人点赞
#self-supervised

RLHF的另一面:基于策略内反馈的奖励模型自监督改进

Hugging Face Daily Papers · 6天前 缓存

SAVE框架通过使用价值函数对策略内响应进行评分,并通过对比目标更新模型,从而改善奖励模型训练,在六个基准测试中取得了优于其他方法的结果。

0 人收藏 0 人点赞
#self-supervised

ChildVox:理解与表征儿童声音的语音、音频及大型音频语言模型基准

Hugging Face Daily Papers · 2026-05-28 缓存

ChildVox 提出了一个全面的基准,用于分析儿童在不同发育阶段的声学交流,整合了来自17个以儿童为中心的音频和语音数据集的20多个子任务。

0 人收藏 0 人点赞
#self-supervised

PilotWiMAE:面向无线信道的导频原生表示学习

arXiv cs.AI · 2026-05-25 缓存

PilotWiMAE提出了一种自监督框架,直接接收含噪的导频观测进行无线信道表示学习,消除了不切实际的全CSI假设,并实现了优于监督基线的鲁棒跨频波束选择和信道估计。

0 人收藏 0 人点赞
#self-supervised

自改进的上下文学习

arXiv cs.CL · 2026-05-25 缓存

本文提出一种方法,通过在测试时优化固定小样本提示的连续嵌入来改进上下文学习,该方法利用模型对数概率导出的自监督置信代理,无需微调或生成令牌。

0 人收藏 0 人点赞
#self-supervised

NITP:面向大语言模型预训练的下一隐式标记预测

Hugging Face Daily Papers · 2026-05-24 缓存

下一隐式标记预测(NITP)通过在表示空间中添加密集的连续监督来增强语言模型预训练,从而在各种模型规模上以极小的计算开销提升泛化能力和性能。

0 人收藏 0 人点赞
#self-supervised

时间对比变换器用于金融犯罪检测:通过预测对比编码实现自监督序列嵌入

arXiv cs.LG · 2026-05-22 缓存

介绍了时间对比变换器(TCT),一种用于从金融交易中学习时间嵌入的自监督框架,用于欺诈检测。仅使用嵌入时AUC达到0.8644,但并未超过强工程特征(AUC 0.9205 vs 0.9245),表明学习到的表示与现有特征存在重叠。

0 人收藏 0 人点赞
#self-supervised

@stephenbtl: My talk at @aiDotEngineer is now online. I talked about our research and where @bfl_ml is heading. Thanks @swyx for the…

X AI KOLs Following · 2026-05-11 缓存

Black Forest Labs 在 AI Engineer 大会上分享了 Flux 系列模型的演进历程,并发布了 SelfFlow 研究论文,提出了一种无需外部编码器的自监督多模态训练方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈