video-representation

#video-representation

You Don't Need Strong Assumptions: Visual Representation Learning via Temporal Differences

Hugging Face Daily Papers ↗ · 5d ago Cached

The paper introduces Temporal Difference in Vision (TDV), a self-supervised learning method for video that relies only on a causal assumption that past causes future, avoiding strong inductive biases while matching state-of-the-art on dense spatial tasks.

0 favorites 0 likes

video-representation

You Don't Need Strong Assumptions: Visual Representation Learning via Temporal Differences

Submit Feedback