open-weights

#open-weights

@PrajwalTomar_: 大家又在忽视MiniMax了。他们刚刚发布了M3。首个结合前沿编码、1…

X AI KOLs Following ↗ · 2026-06-04 缓存

MiniMax发布了M3，一个开放权重模型，结合了前沿编码、1M上下文和原生多模态能力，性能与Opus相当，但成本仅为其一小部分。

0 人收藏 0 人点赞

#open-weights

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face

Reddit r/LocalLLaMA ↗ · 2026-06-04

NVIDIA发布Nemotron-3-Ultra-550B-A55B，这是一个5500亿参数（550亿活跃参数）的前沿大语言模型，采用混合LatentMoE架构，结合Mamba-2、MoE和注意力层，支持高达100万令牌的上下文长度和可配置的推理模式。它支持11种语言，并针对复杂的智能体工作流、长上下文分析和高精度推理进行了优化。

0 人收藏 0 人点赞

#open-weights

Gemma 2B多模态模型无需编码器即可媲美更大模型

Reddit r/singularity ↗ · 2026-06-04

谷歌的Gemma 4 12B引入了无需编码器的多模态架构，可与更大模型竞争，但基准测试对比显示它在大多数任务上落后于Qwen 2.5 9B。文章还涵盖了相关进展，包括开放权重模型的安全风险、Uber对Claude Code的支出上限以及NeurIPS对未校准AI检测器的误用。

0 人收藏 0 人点赞

#open-weights

@svpino: 人类在交谈时的平均延迟为200-250毫秒。这款语音模型甚至更快：仅110…

X AI KOLs Following ↗ · 2026-06-03

一款开放权重的8B参数语音模型仅需110毫秒延迟，比人类平均对话延迟200-250毫秒更快。它可以在本地运行，并通过GitHub仓库免费获取。

0 人收藏 0 人点赞

#open-weights

@HuggingPapers：谷歌刚刚在Hugging Face上发布了Magenta RealTime 2，这是唯一一个用于实时连续音乐生成的开源权重模型……

X AI KOLs Following ↗ · 2026-06-03 缓存

谷歌在Hugging Face上发布了Magenta RealTime 2，这是一个开源权重模型，可在设备上实现实时连续音乐生成，延迟约200毫秒，并可通过文本、音频或MIDI进行控制。

0 人收藏 0 人点赞

#open-weights

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Hugging Face Models Trending ↗ · 2026-06-03 缓存

NVIDIA 发布 Nemotron-3-Ultra，一个拥有 5500 亿参数的开源权重模型，采用结合 Mamba-2、MoE 和注意力的混合架构，支持高达 100 万 token 的上下文长度和可配置的推理模式。

0 人收藏 0 人点赞

#open-weights

Microsoft Aion 1.0 Instruct 和 Aion 1.0 Plan 模型！

Reddit r/LocalLLaMA ↗ · 2026-06-03

微软在 Build 2026 上宣布了两款新的设备端 AI 模型：Aion 1.0 Instruct（一款开放权重的小型语言模型）和 Aion 1.0 Plan（一款 140 亿参数的推理与工具调用模型，适用于本地智能体工作流）。

0 人收藏 0 人点赞

#open-weights

@swyx: 链接汇总：

X AI KOLs Following ↗ · 2026-06-02 缓存

NVIDIA 发布 Cosmos 3（混合 Transformer 模型，参数最高达 64B）、Nemotron 3 Ultra（550B-A55B 大语言模型），并在 Computex 2026 上预览了 RTX Spark 个人超级芯片，在多个开源模型排行榜上达到 SOTA。

0 人收藏 0 人点赞

#open-weights

我刚刚根据DeepSWE基准数据创建了一份详细报告

Reddit r/singularity ↗ · 2026-06-01

对DeepSWE基准数据的分析揭示了模型之间令人惊讶的成本和性能差异，GPT 5.5在能力和成本效率方面领先，而开放权重模型每次通过的成本可能很高。

0 人收藏 0 人点赞

#open-weights

@RyanLeeMiniMax: MiniMax-M3 将于下周在 HuggingFace 上以开源权重形式发布！

X AI KOLs Following ↗ · 2026-06-01 缓存

MiniMax 宣布推出 MiniMax-M3，这是一款结合前沿编程和代理能力的开源权重模型，采用稀疏注意力机制扩展至 1M 上下文，计划于下周在 HuggingFace 上线。

0 人收藏 0 人点赞

#open-weights

@MiniMax_AI：介绍MiniMax M3：首个结合三大前沿能力的开源权重模型——编程与智能体前沿…

X AI KOLs Timeline ↗ · 2026-06-01 缓存

MiniMax发布了MiniMax M3，这是首个开源权重AI模型，集成了编码和智能体任务的前沿能力，通过稀疏注意力扩展到100万上下文，取得了强劲的基准分数。

0 人收藏 0 人点赞

#open-weights

MiniMax M3（2分钟阅读）

TLDR AI ↗ · 2026-06-01 缓存

MiniMax 推出了 M3，这是首个结合编程、智能体与多模态能力的开源权重模型，通过稀疏注意力机制支持高达 100 万 token 的上下文。

0 人收藏 0 人点赞

#open-weights

安全护栏持续改进，但如果开源权重模型超越基于云的模型会发生什么？

Reddit r/artificial ↗ · 2026-05-31

本文探讨了开源权重模型在性能上可能超越基于云的模型的影响，同时指出安全护栏正在改进。

0 人收藏 0 人点赞

#open-weights

1-Bit Bonsai Image 4B 本地设备图像生成

Hacker News Top ↗ · 2026-05-31 缓存

PrismML 发布 Bonsai Image 4B，这是一系列紧凑型图像生成模型，使用 1-bit 和三进制权重，能够在笔记本电脑和 iPhone 等本地设备上实现高质量扩散推理，同时显著减少内存占用。

0 人收藏 0 人点赞

#open-weights

开源权重VLA在17个真实机器人任务中的4个上实现了80%以上的任务进度，零微调。附带演示视频。

Reddit r/singularity ↗ · 2026-05-31

发布Wall-OSS-0.5，一个开源权重的视觉-语言-动作模型，在17个真实机器人任务中的4个上实现了超过80%的任务进度，且无需微调，包括一个预训练中未见过的可变形绳索任务。该模型在提升具身接地能力的同时，保留了通用的视觉-语言能力。

0 人收藏 0 人点赞

#open-weights

G7就开源AI与开放权重AI的共同术语达成一致

Reddit r/artificial ↗ · 2026-05-30 缓存

G7数字与技术部长级会议就开源与开放权重AI的共同术语达成共识，定义了诸如“带开放数据的开源AI”、“开源AI”、“开放权重AI”和“权重可获取AI”等类别，以标准化围绕AI开放性的讨论。

0 人收藏 0 人点赞

#open-weights

ideogram-ai/ideogram-4-nf4

Hugging Face Models Trending ↗ · 2026-05-30 缓存

Ideogram 发布了 Ideogram 4，这是他们首个从头训练的开放权重文本生成图像模型，具备业界领先的多语言文字渲染能力、JSON 结构化提示词、边界框布局控制以及原生 2K 分辨率输出。NF4 量化版本已在 Hugging Face 上发布，该模型被认为是目前最优秀的开放权重图像模型，可与专有前沿模型相媲美。

0 人收藏 0 人点赞

#open-weights