representation-learning

#representation-learning

PORTER: 基于语言的事件表示实现可移植结构化电子病历基础模型

arXiv cs.CL ↗ · 昨天缓存

PORTER是一种基于语言的结构化电子病历基础模型，通过文本描述和数值表示临床事件，能够实现跨机构的词汇无关迁移，无需重新训练。在儿科预测任务中，PORTER与固定词汇模型性能相当，并在迁移至未见事件描述时恢复了97.1%的AUROC。

0 人收藏 0 人点赞

#representation-learning

@ChrisInterno: 物理合理性的信号隐藏在冻结图像编码器的几何结构中。无需视频训练。无需物理监督…

X AI KOLs Following ↗ · 3天前缓存

该推文强调了一项研究发现：无需视频训练或物理监督，即可从冻结图像编码器的几何结构中提取物理合理性的信号。

0 人收藏 0 人点赞

#representation-learning

DVD-JEPA：一个开源、完全可复现的JEPA世界模型 [P]

Reddit r/MachineLearning ↗ · 4天前

DVD-JEPA 是一个开源、极简的 JEPA 世界模型，它通过预测未来嵌入而非像素来从视频中学习表示。它使用弹跳的 DVD 标志来演示位置恢复、梦境生成和异常检测，所有这些都在浏览器中运行。

0 人收藏 0 人点赞

#representation-learning

EvoEmbedding：面向长上下文检索与智能体记忆的可演化表示

Hugging Face Daily Papers ↗ · 6天前缓存

EvoEmbedding是一种动态嵌入模型，它维护一个持续更新的潜在记忆，为长上下文检索生成自适应表示，性能优于更大的专业模型，并改进智能体工作流。

0 人收藏 0 人点赞

#representation-learning

PoLAR: 因子化潜动作中的范围与模式以用于机器人策略学习

Hugging Face Daily Papers ↗ · 6天前缓存

PoLAR 在双曲空间中引入了一种具有几何结构的潜动作表示，将转换范围与模式分离，从而提升机器人策略学习性能。

0 人收藏 0 人点赞

#representation-learning

超越分词：面向时间序列问答的直接时间步嵌入与对比对齐

arXiv cs.CL ↗ · 2026-06-18 缓存

本文介绍CADE，一个用于时间序列问答的框架，它直接将每个时间步映射到LLM嵌入空间，并使用单向监督对比损失将时间序列表示与冻结的文本锚点对齐，在Time-MQA基准测试上超越了现有基线。

0 人收藏 0 人点赞

#representation-learning

概念调制模型：可识别性与外推的统一框架

arXiv cs.LG ↗ · 2026-06-18 缓存

本文介绍了概念调制模型（CMMs），一个用于条件生成模型可识别性和外推的统一框架。它表明，已观测属性上的特征一致性通过属性势产生约束，从而使得代数外推准则能够恢复并泛化现有结果。

0 人收藏 0 人点赞

#representation-learning

基于局部线性嵌入和自适应特征融合的结构化表示学习

arXiv cs.LG ↗ · 2026-06-18 缓存

提出了一种强化学习框架，利用局部线性嵌入捕捉环境动态，并通过注意力机制自适应融合动态特定特征和奖励特定特征，受神经科学原理启发，提高了学习效率。

0 人收藏 0 人点赞

#representation-learning

何时、何地、如何：面向表格自监督学习的自适应分箱方法

Hugging Face Daily Papers ↗ · 2026-06-18 缓存

本文提出自适应分箱（Adaptive Binning），一种针对表格自监督学习的、与学习过程耦合的特征级粗到细课程，能够自适应地离散化特征，在医学数据集上提升表示质量，并建立了统一的基准测试。

0 人收藏 0 人点赞

#representation-learning

下一代潜在预测变换器 [R]

Reddit r/MachineLearning ↗ · 2026-06-17

微软研究院提出Next-Latent Prediction (NextLat)方法，一种自监督学习方法，训练变换器预测自身下一个潜在状态，从而形成用于推理和规划的紧凑世界模型，并通过自推测解码实现高达3.3倍的推理加速。

0 人收藏 0 人点赞

#representation-learning

通过干预后训练语音基础模型学习任务特定子空间

arXiv cs.CL ↗ · 2026-06-17 缓存

本文提出了一种利用干预对比学习的后训练优化方法，将语音基础模型的表示解耦为独立的内容和说话人子空间。该方法在域外说话人验证任务上表现出更优性能，并提供了成功分离的证据。

0 人收藏 0 人点赞

#representation-learning

MoCo-AIS：一种用于船只轨迹相似度计算的对比学习框架

arXiv cs.AI ↗ · 2026-06-17 缓存

MoCo-AIS 是一个统一的对比学习框架，用于计算船只轨迹的相似度，并在大规模AIS数据集上进行了评估。

0 人收藏 0 人点赞

#representation-learning

探测、融合与可信度：面向多模态癌症分析的基础模型表征系统评估

arXiv cs.LG ↗ · 2026-06-17 缓存

本文系统评估了用于多模态癌症分析的基础模型表征，在真实世界队列上对单模态与多模态融合策略进行基准测试，并通过共形预测评估可信度。

0 人收藏 0 人点赞

#representation-learning

@AlexiGlad: 人工智能的进步源于采用更弱假设的方法，这使其能够更好地扩展。但表示…

X AI KOLs Following ↗ · 2026-06-16 缓存

引入了视觉时域差分（TDV），这是一种全新的表示学习范式，仅依赖于因果关系，无需数据增强、掩码或裁剪，并在密集空间任务上达到了与DINO和iBOT等最先进方法相当的性能。

0 人收藏 0 人点赞

#representation-learning

@ninaddaithankar: 视觉模型能否在没有数据增强、掩码、裁剪或重建的情况下学会观察？它可以！介绍……

X AI KOLs Timeline ↗ · 2026-06-16 缓存

介绍了时间差视觉表征学习范式（Temporal Difference in Vision, TDV），这是一种新颖的视觉表征学习范式，无需数据增强、掩码、裁剪或重建即可学习有用的表征，并在密集空间任务上达到与最先进方法相当的性能。

0 人收藏 0 人点赞

#representation-learning

克服阻抗不匹配：融合基础模型与知识图谱的理论路线图

arXiv cs.AI ↗ · 2026-06-16 缓存

本文正式提出了基础模型与知识图谱之间的“阻抗不匹配”概念，并利用结构化残差流、向量符号架构和正交子空间编辑，提出了一种神经符号融合的理论路线图。

0 人收藏 0 人点赞

#representation-learning

AI Engram：探寻人工智能中的记忆痕迹

arXiv cs.AI ↗ · 2026-06-16 缓存

提出一个几何框架来识别“AI engrams”——深度神经网络中的记忆痕迹——将神经科学标准形式化为一个闭式估计器，使得从MLP到LLM的模型能够进行精确的记忆操作。

0 人收藏 0 人点赞

#representation-learning

RECTOR：面向情感和认知表征学习的掩码区域-通道-时间建模

arXiv cs.LG ↗ · 2026-06-16 缓存

RECTOR 是一个自监督框架，从 EEG/sEEG 信号中学习联合的区域-通道-时间表征，用于情感和认知状态分类，在情绪识别和任务参与度基准测试中取得了最先进的结果。

0 人收藏 0 人点赞

#representation-learning

大小不重要：余弦评分稀疏自编码器

arXiv cs.LG ↗ · 2026-06-16 缓存

本文提出用余弦相似度与输入幅值的可学习组合替代稀疏自编码器中的内积评分，结果表明所得特征更具可解释性且与概念对齐，优化器始终偏好余弦而非内积。

0 人收藏 0 人点赞

#representation-learning

解锁潜在维度：使用变分自编码器探索大规模X射线散射数据的表征

arXiv cs.LG ↗ · 2026-06-16 缓存

本文探讨了使用变分自编码器学习大规模X射线散射数据的潜在表征，从而实现高效的数据压缩和分析。

0 人收藏 0 人点赞

representation-learning

提交意见反馈