open-weights

#open-weights

GLM 5.2 API 已上线，权重已上传至 HF，Ollama 也已支持

Reddit r/LocalLLaMA ↗ · 2026-06-16

GLM 5.2 已发布，采用 MIT 许可协议在 HuggingFace 上开放权重，可通过 API 和 Ollama 获取，其基准测试结果具有竞争力，仅落后 Opus 4.8 一个点，领先 GPT-5.5 一个点。

0 人收藏 0 人点赞

#open-weights

GLM-5.2 是首个在 Terminal-Bench 上突破 80% 的开源权重模型，超越了所有其他开源模型。

Reddit r/LocalLLaMA ↗ · 2026-06-16

GLM-5.2 是首个在 Terminal-Bench 上超过 80% 的开源权重模型，超越了所有其他开源模型乃至 Gemini，使其以极低的成本成为前沿水准的模型。

0 人收藏 0 人点赞

#open-weights

Claude Fable 5 蒸馏版

Reddit r/LocalLLaMA ↗ · 2026-06-16 缓存

Qwable-v1 是一个开放权重的代理编码模型（35B MoE，3B 活跃参数），通过串联来自 Claude Opus 4.7 推理和 Claude Fable-5 代理工具使用轨迹的蒸馏构建。它能够显式思考 CoT 链，并在提示时充当类似 Claude-Code 风格的代理。

0 人收藏 0 人点赞

#open-weights

为什么华为的Atlas卡没有成为主流？

Reddit r/LocalLLaMA ↗ · 2026-06-15

一位用户质疑为何华为的Atlas卡未被广泛采用，并猜测中国是否有潜力生产消费级GPU来挑战Nvidia的垄断地位。

0 人收藏 0 人点赞

#open-weights

z.ai X上的投票：MIT许可的开放权重正在落后

Reddit r/LocalLLaMA ↗ · 2026-06-14

X上的一个投票显示，MIT许可的开放权重在还剩7小时、已有1800票投出的情况下正在落后。

0 人收藏 0 人点赞

#open-weights

2026年中本地模型

Reddit r/LocalLLaMA ↗ · 2026-06-14 缓存

2026年中本地AI模型的技术概览，重点介绍开放权重模型如何通过混合专家模型和稀疏注意力机制的进步缩小了与前沿模型的差距，从而实现高效的本地推理。

0 人收藏 0 人点赞

#open-weights

@awnihannun: @angeloskath 关于使用MLX构建本地自主AI的视频非常出色。我还听说这是观看次数最多的视频之一……

X AI KOLs Following ↗ · 2026-06-12 缓存

一条推文强调了Angelos Kath在WWDC上关于使用MLX构建本地自主AI的出色视频，指出开源权重模型和硬件能力的快速进展。

0 人收藏 0 人点赞

#open-weights

更便宜、更快且具有文化感知力，Avataar的视频AI专为印度的大规模应用而构建

TechCrunch AI ↗ · 2026-06-12 缓存

Avataar AI推出Varya，这是一款针对印度规模和背景优化的视频生成模型，利用从Wan 2.2蒸馏的技术，实现了20倍成本降低和对本地细微差别的理解。

0 人收藏 0 人点赞

#open-weights

Minimax M3 计划于周五发布开放权重

Reddit r/LocalLLaMA ↗ · 2026-06-11 缓存

MiniMaxAI 宣布计划于周五为其即将发布的 M3 模型发布开放权重，继之前的 M2.7 模型之后。

0 人收藏 0 人点赞

#open-weights

DiffusionGemma

Simon Willison's Blog ↗ · 2026-06-10 缓存

Google 发布了 DiffusionGemma，这是一个采用 Apache 2 许可证的开源权重文本生成模型（总参数量 26B，活跃参数量 4B），通过 NVIDIA 的 NIM 云 API 展示了极高的推理速度。

0 人收藏 0 人点赞

#open-weights

@Modular：我们的内核团队整周都在深入研究 MiniMax M3。百万token上下文和原生多模态让它的服务模式变得困难……

X AI KOLs Following ↗ · 2026-06-09 缓存

Modular 的内核团队正在优化对 MiniMax M3 的百万token上下文和原生多模态的服务，开放权重即将发布，可立即在 Modular 上部署。

0 人收藏 0 人点赞

#open-weights

@danveloper: https://x.com/danveloper/status/2064387956387758206

X AI KOLs Timeline ↗ · 2026-06-09 缓存

一位开发者通过在NVMe SSD上流式传输模型权重，在树莓派5上运行了DeepSeek-V4-Flash，达到了1.3 tokens/秒的速率，功耗仅8瓦，证明了前沿级别的开放权重模型在低成本、离线硬件上的可行性。

0 人收藏 0 人点赞

#open-weights

我们的ICML论文：可预测幻觉（信息预算弃权门）及今日发布的免训练开源权重实现ntkMirror

Reddit r/LocalLLaMA ↗ · 2026-06-09

一篇被ICML 2026接收的论文提出了通过信息预算弃权门实现可预测幻觉的方法，并发布了ntkMirror——一种免训练的开源权重实现，通过在信息不足时弃权来减少幻觉，在约24%弃权率下实现0.0–0.7%的幻觉率。

0 人收藏 0 人点赞

#open-weights

@cohere: 我们鼓励开发者与我们分享他们的构建，并提供反馈以塑造未来的迭代。让我们一起塑造未…

X AI KOLs Following ↗ · 2026-06-09 缓存

Cohere 和 Cohere Labs 发布了 North Mini Code，这是一个开放权重的 30B-A3B 参数模型，针对代码生成、智能体软件工程和终端任务进行了优化，在 SWE-Bench 和 Terminal-Bench 上取得了强劲的基准测试结果。

0 人收藏 0 人点赞

#open-weights

我对Parakeet 0.6B进行了医学ASR微调——开放权重，本地运行于Mac/CUDA/CPU

Reddit r/LocalLLaMA ↗ · 2026-06-09

Omi Health创始人微调了NVIDIA的Parakeet TDT 0.6B用于医学ASR，发布了开放权重的模型Omi Med STT v1，在本地Mac、CUDA或CPU上运行时实现了有竞争力的医学WER。

0 人收藏 0 人点赞

#open-weights

BitNet是个死胡同吗？三进制大语言模型发生了什么？

Reddit r/LocalLLaMA ↗ · 2026-06-08

文章质疑为何像BitNet这样的三进制语言模型在初期显示出潜力后，却未能扩展到超过2B参数，并讨论了开放权重AI实验室明显缺乏进展的情况。

0 人收藏 0 人点赞

#open-weights

@victormustar: 在本周结束之前，让我们回顾一下开放AI领域最疯狂的一周，发布了超过25个引人注目的开放权重模型…

X AI KOLs Following ↗ · 2026-06-05 缓存

本周开放AI领域异常精彩，发布了超过25个开放权重模型，涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域，NVIDIA、Google等机构贡献突出。

0 人收藏 0 人点赞

#open-weights

CohereLabs/North-Mini-Code-1.0

Hugging Face Models Trending ↗ · 2026-06-05 缓存

Cohere Labs 发布了 North Mini Code，一个拥有 30B 参数（3B 活跃）的开放权重模型，针对代码生成、智能体软件工程和终端任务进行了优化，基于 Apache 2.0 许可。

0 人收藏 0 人点赞

#open-weights

google/gemma-4-12B-it-qat-q4_0-gguf

Hugging Face Models Trending ↗ · 2026-06-05 缓存

Google DeepMind 发布了 Gemma 4 模型，这些模型通过量化感知训练（QAT）进行了优化，并提供包括 GGUF 在内的多种格式，在降低内存需求的同时实现了高质量。

0 人收藏 0 人点赞

#open-weights

@MaximeRivest: NVIDIA 发布了 Nemotron 550B Ultra！它的工具调用和标准系统提示非常非常非常简洁，而且……

X AI KOLs Following ↗ · 2026-06-04

NVIDIA 发布了 Nemotron 550B Ultra，这是一个大型语言模型，采用简洁的基于 XML 的工具调用接口，而非 JSON 模式。工具结果以用户消息的形式嵌入 XML 标签中返回。

0 人收藏 0 人点赞

open-weights

提交意见反馈