dclm

标签

Cards List
#dclm

@kothasuhas: 非常非常棒的工作。TLDR:在无限计算资源的条件下,过滤 _any_ 数据可能都没有意义。

X AI KOLs Following · 2026-05-21 缓存

新研究表明,在拥有充足计算资源的情况下,语言模型训练数据的过滤可能并不必要,模型反而能从低质量数据中受益。

0 人收藏 0 人点赞
#dclm

@tatsu_hashimoto: 我发推文给Chris(他不在线)的一些令人惊讶的新结果。只要有足够的算力,最好的数据…

X AI KOLs Following · 2026-05-21 缓存

令人惊讶的新结果表明,对于大型语言模型(LLM),只要有足够的算力,最好的数据过滤器可能就是没有过滤器,因为它们能很好地容忍低质量数据。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈