@charles_irl: 为何要用很多字节,少量也能搞定?

X AI KOLs Following 新闻

摘要

Modal 的 Nan Jiang 宣布他们正在开发开源 RL 框架以支持前沿的开放权重模型,重点介绍了增量压缩以及在权重同步和跨集群训练方面依然存在的挑战。

为何要用很多字节,少量也能搞定?
查看原文
查看缓存全文

缓存时间: 2026/06/01 03:07

少字节即可,何须多用?

Nan Jiang (@nanjiangwill): 在 @modal,我们致力于确保开源强化学习框架拥有训练前沿开放权重模型所需的所有技术。

增量压缩是关键,但工作尚未完成。在权重同步、自动伸缩和跨集群训练方面仍有许多开放问题。

相似文章

开源权重模型并非通过抄袭来追赶闭源模型,它们之所以胜出,是因为整个AI堆栈正在悄然模块化

Reddit r/singularity

本文认为,开源权重AI模型追赶闭源模型并非通过蒸馏技术,而是得益于AI堆栈的模块化——稳定的接口(Transformer架构、兼容OpenAI的推理API、智能体框架)使得创新能在整个生态系统中迅速扩散,在缩小能力差距的同时保持巨大的价格优势,最终可能导致前沿AI的商品化。

彭罗斯瓷砖的图示

Lobsters Hottest

这篇博文描述了如何使用 Haskell Diagrams 包生成彭罗斯的风筝和飞镖非周期性铺砌的有限区域,并介绍了一个用于构建这些铺砌的 Haskell 包(PenroseKiteDart)。

Bartowski 已发布 DS4 GGUF

Reddit r/LocalLLaMA

Bartowski 发布了 DeepSeek-V4-Flash 的 GGUF 量化版本,并邀请用户与 Antirez 的版本进行对比。