@charles_irl: 为何要用很多字节,少量也能搞定?
摘要
Modal 的 Nan Jiang 宣布他们正在开发开源 RL 框架以支持前沿的开放权重模型,重点介绍了增量压缩以及在权重同步和跨集群训练方面依然存在的挑战。
为何要用很多字节,少量也能搞定?
查看缓存全文
缓存时间: 2026/06/01 03:07
少字节即可,何须多用?
Nan Jiang (@nanjiangwill): 在 @modal,我们致力于确保开源强化学习框架拥有训练前沿开放权重模型所需的所有技术。
增量压缩是关键,但工作尚未完成。在权重同步、自动伸缩和跨集群训练方面仍有许多开放问题。
相似文章
开源权重模型并非通过抄袭来追赶闭源模型,它们之所以胜出,是因为整个AI堆栈正在悄然模块化
本文认为,开源权重AI模型追赶闭源模型并非通过蒸馏技术,而是得益于AI堆栈的模块化——稳定的接口(Transformer架构、兼容OpenAI的推理API、智能体框架)使得创新能在整个生态系统中迅速扩散,在缩小能力差距的同时保持巨大的价格优势,最终可能导致前沿AI的商品化。
彭罗斯瓷砖的图示
这篇博文描述了如何使用 Haskell Diagrams 包生成彭罗斯的风筝和飞镖非周期性铺砌的有限区域,并介绍了一个用于构建这些铺砌的 Haskell 包(PenroseKiteDart)。
Bartowski 已发布 DS4 GGUF
Bartowski 发布了 DeepSeek-V4-Flash 的 GGUF 量化版本,并邀请用户与 Antirez 的版本进行对比。
保范Abliteration应用于Qwen3.6-35B-A3B:0%拒绝率,基准测试性能完整,开源数据集
对Qwen3.6-35B-A3B应用保范Abliteration技术,实现0%拒绝率,基准测试性能保持不变,并发布了开源数据集。
@mattpocockuk: 将 Martin Fowler 的《重构》中的一组代码异味添加到我的 /review 技能中:Mysterious Name, Duplicated Code, Fe…
Matt Pocock 宣布将 Martin Fowler 的代码异味添加到他的 /review 技能中,该技能用于 AI 编码代理,并分享了他的开源可组合代理技能集合,旨在改善实际工程工作流。