标签
AllenAI 发布 MolmoMotion,一种旨在基于短帧历史预测未来运动的视觉模型。
SAMOSA将SAM 2适配到视觉目标跟踪任务中,通过整合运动预测、语义检测和几何约束,提升在存在干扰物、遮挡和非线性运动的复杂场景下的鲁棒性和泛化能力。