标签
本文提出COM方法,该方法对时间序列令牌嵌入施加连续性和序数性约束,以提升基于令牌的时间序列大语言模型的性能。
SAMOSA将SAM 2适配到视觉目标跟踪任务中,通过整合运动预测、语义检测和几何约束,提升在存在干扰物、遮挡和非线性运动的复杂场景下的鲁棒性和泛化能力。
GeoStack 引入了一种几何框架,用于在视觉语言模型中组合独立训练的领域专家,而不会出现灾难性遗忘,实现了常数时间推理,并将几何误差降低了10倍。