dclm

标签

#dclm

@kothasuhas: 非常非常棒的工作。TLDR：在无限计算资源的条件下，过滤 _any_ 数据可能都没有意义。

X AI KOLs Following ↗ · 2026-05-21 缓存

新研究表明，在拥有充足计算资源的情况下，语言模型训练数据的过滤可能并不必要，模型反而能从低质量数据中受益。

0 人收藏 0 人点赞

#dclm

@tatsu_hashimoto: 我发推文给Chris（他不在线）的一些令人惊讶的新结果。只要有足够的算力，最好的数据…

X AI KOLs Following ↗ · 2026-05-21 缓存

令人惊讶的新结果表明，对于大型语言模型（LLM），只要有足够的算力，最好的数据过滤器可能就是没有过滤器，因为它们能很好地容忍低质量数据。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈