标签
PORTER是一种基于语言的结构化电子病历基础模型,通过文本描述和数值表示临床事件,能够实现跨机构的词汇无关迁移,无需重新训练。在儿科预测任务中,PORTER与固定词汇模型性能相当,并在迁移至未见事件描述时恢复了97.1%的AUROC。
该推文强调了一项研究发现:无需视频训练或物理监督,即可从冻结图像编码器的几何结构中提取物理合理性的信号。
DVD-JEPA 是一个开源、极简的 JEPA 世界模型,它通过预测未来嵌入而非像素来从视频中学习表示。它使用弹跳的 DVD 标志来演示位置恢复、梦境生成和异常检测,所有这些都在浏览器中运行。
EvoEmbedding是一种动态嵌入模型,它维护一个持续更新的潜在记忆,为长上下文检索生成自适应表示,性能优于更大的专业模型,并改进智能体工作流。
PoLAR 在双曲空间中引入了一种具有几何结构的潜动作表示,将转换范围与模式分离,从而提升机器人策略学习性能。
本文介绍CADE,一个用于时间序列问答的框架,它直接将每个时间步映射到LLM嵌入空间,并使用单向监督对比损失将时间序列表示与冻结的文本锚点对齐,在Time-MQA基准测试上超越了现有基线。
本文介绍了概念调制模型(CMMs),一个用于条件生成模型可识别性和外推的统一框架。它表明,已观测属性上的特征一致性通过属性势产生约束,从而使得代数外推准则能够恢复并泛化现有结果。
提出了一种强化学习框架,利用局部线性嵌入捕捉环境动态,并通过注意力机制自适应融合动态特定特征和奖励特定特征,受神经科学原理启发,提高了学习效率。
本文提出自适应分箱(Adaptive Binning),一种针对表格自监督学习的、与学习过程耦合的特征级粗到细课程,能够自适应地离散化特征,在医学数据集上提升表示质量,并建立了统一的基准测试。
微软研究院提出Next-Latent Prediction (NextLat)方法,一种自监督学习方法,训练变换器预测自身下一个潜在状态,从而形成用于推理和规划的紧凑世界模型,并通过自推测解码实现高达3.3倍的推理加速。
本文提出了一种利用干预对比学习的后训练优化方法,将语音基础模型的表示解耦为独立的内容和说话人子空间。该方法在域外说话人验证任务上表现出更优性能,并提供了成功分离的证据。
MoCo-AIS 是一个统一的对比学习框架,用于计算船只轨迹的相似度,并在大规模AIS数据集上进行了评估。
本文系统评估了用于多模态癌症分析的基础模型表征,在真实世界队列上对单模态与多模态融合策略进行基准测试,并通过共形预测评估可信度。
引入了视觉时域差分(TDV),这是一种全新的表示学习范式,仅依赖于因果关系,无需数据增强、掩码或裁剪,并在密集空间任务上达到了与DINO和iBOT等最先进方法相当的性能。
介绍了时间差视觉表征学习范式(Temporal Difference in Vision, TDV),这是一种新颖的视觉表征学习范式,无需数据增强、掩码、裁剪或重建即可学习有用的表征,并在密集空间任务上达到与最先进方法相当的性能。
本文正式提出了基础模型与知识图谱之间的“阻抗不匹配”概念,并利用结构化残差流、向量符号架构和正交子空间编辑,提出了一种神经符号融合的理论路线图。
提出一个几何框架来识别“AI engrams”——深度神经网络中的记忆痕迹——将神经科学标准形式化为一个闭式估计器,使得从MLP到LLM的模型能够进行精确的记忆操作。
RECTOR 是一个自监督框架,从 EEG/sEEG 信号中学习联合的区域-通道-时间表征,用于情感和认知状态分类,在情绪识别和任务参与度基准测试中取得了最先进的结果。
本文提出用余弦相似度与输入幅值的可学习组合替代稀疏自编码器中的内积评分,结果表明所得特征更具可解释性且与概念对齐,优化器始终偏好余弦而非内积。
本文探讨了使用变分自编码器学习大规模X射线散射数据的潜在表征,从而实现高效的数据压缩和分析。