latent-prediction

标签

Cards List
#latent-prediction

@MatthieuWyart: LLMs通过预测token来学习。世界模型(JEPA、data2vec)通过预测自身的抽象表示来学习。哪种需要更多数据?

X AI KOLs Timeline · 2026-06-01 缓存

本文证明,对于具有隐藏结构的分层数据,通过预测潜在表示(如JEPA和data2vec等世界模型的做法)进行学习所需的数据量,远少于通过预测token(如LLMs的做法)进行学习,其差距呈指数级。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈