open-weights

标签

Cards List
#open-weights

@PrajwalTomar_: 大家又在忽视MiniMax了。他们刚刚发布了M3。首个结合前沿编码、1…

X AI KOLs Following · 2026-06-04 缓存

MiniMax发布了M3,一个开放权重模型,结合了前沿编码、1M上下文和原生多模态能力,性能与Opus相当,但成本仅为其一小部分。

0 人收藏 0 人点赞
#open-weights

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face

Reddit r/LocalLLaMA · 2026-06-04

NVIDIA发布Nemotron-3-Ultra-550B-A55B,这是一个5500亿参数(550亿活跃参数)的前沿大语言模型,采用混合LatentMoE架构,结合Mamba-2、MoE和注意力层,支持高达100万令牌的上下文长度和可配置的推理模式。它支持11种语言,并针对复杂的智能体工作流、长上下文分析和高精度推理进行了优化。

0 人收藏 0 人点赞
#open-weights

Gemma 2B多模态模型无需编码器即可媲美更大模型

Reddit r/singularity · 2026-06-04

谷歌的Gemma 4 12B引入了无需编码器的多模态架构,可与更大模型竞争,但基准测试对比显示它在大多数任务上落后于Qwen 2.5 9B。文章还涵盖了相关进展,包括开放权重模型的安全风险、Uber对Claude Code的支出上限以及NeurIPS对未校准AI检测器的误用。

0 人收藏 0 人点赞
#open-weights

@svpino: 人类在交谈时的平均延迟为200-250毫秒。这款语音模型甚至更快:仅110…

X AI KOLs Following · 2026-06-03

一款开放权重的8B参数语音模型仅需110毫秒延迟,比人类平均对话延迟200-250毫秒更快。它可以在本地运行,并通过GitHub仓库免费获取。

0 人收藏 0 人点赞
#open-weights

@HuggingPapers:谷歌刚刚在Hugging Face上发布了Magenta RealTime 2,这是唯一一个用于实时连续音乐生成的开源权重模型……

X AI KOLs Following · 2026-06-03 缓存

谷歌在Hugging Face上发布了Magenta RealTime 2,这是一个开源权重模型,可在设备上实现实时连续音乐生成,延迟约200毫秒,并可通过文本、音频或MIDI进行控制。

0 人收藏 0 人点赞
#open-weights

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Hugging Face Models Trending · 2026-06-03 缓存

NVIDIA 发布 Nemotron-3-Ultra,一个拥有 5500 亿参数的开源权重模型,采用结合 Mamba-2、MoE 和注意力的混合架构,支持高达 100 万 token 的上下文长度和可配置的推理模式。

0 人收藏 0 人点赞
#open-weights

Microsoft Aion 1.0 Instruct 和 Aion 1.0 Plan 模型!

Reddit r/LocalLLaMA · 2026-06-03

微软在 Build 2026 上宣布了两款新的设备端 AI 模型:Aion 1.0 Instruct(一款开放权重的小型语言模型)和 Aion 1.0 Plan(一款 140 亿参数的推理与工具调用模型,适用于本地智能体工作流)。

0 人收藏 0 人点赞
#open-weights

@swyx: 链接汇总:

X AI KOLs Following · 2026-06-02 缓存

NVIDIA 发布 Cosmos 3(混合 Transformer 模型,参数最高达 64B)、Nemotron 3 Ultra(550B-A55B 大语言模型),并在 Computex 2026 上预览了 RTX Spark 个人超级芯片,在多个开源模型排行榜上达到 SOTA。

0 人收藏 0 人点赞
#open-weights

我刚刚根据DeepSWE基准数据创建了一份详细报告

Reddit r/singularity · 2026-06-01

对DeepSWE基准数据的分析揭示了模型之间令人惊讶的成本和性能差异,GPT 5.5在能力和成本效率方面领先,而开放权重模型每次通过的成本可能很高。

0 人收藏 0 人点赞
#open-weights

@RyanLeeMiniMax: MiniMax-M3 将于下周在 HuggingFace 上以开源权重形式发布!

X AI KOLs Following · 2026-06-01 缓存

MiniMax 宣布推出 MiniMax-M3,这是一款结合前沿编程和代理能力的开源权重模型,采用稀疏注意力机制扩展至 1M 上下文,计划于下周在 HuggingFace 上线。

0 人收藏 0 人点赞
#open-weights

@MiniMax_AI:介绍MiniMax M3:首个结合三大前沿能力的开源权重模型——编程与智能体前沿…

X AI KOLs Timeline · 2026-06-01 缓存

MiniMax发布了MiniMax M3,这是首个开源权重AI模型,集成了编码和智能体任务的前沿能力,通过稀疏注意力扩展到100万上下文,取得了强劲的基准分数。

0 人收藏 0 人点赞
#open-weights

MiniMax M3(2分钟阅读)

TLDR AI · 2026-06-01 缓存

MiniMax 推出了 M3,这是首个结合编程、智能体与多模态能力的开源权重模型,通过稀疏注意力机制支持高达 100 万 token 的上下文。

0 人收藏 0 人点赞
#open-weights

安全护栏持续改进,但如果开源权重模型超越基于云的模型会发生什么?

Reddit r/artificial · 2026-05-31

本文探讨了开源权重模型在性能上可能超越基于云的模型的影响,同时指出安全护栏正在改进。

0 人收藏 0 人点赞
#open-weights

1-Bit Bonsai Image 4B 本地设备图像生成

Hacker News Top · 2026-05-31 缓存

PrismML 发布 Bonsai Image 4B,这是一系列紧凑型图像生成模型,使用 1-bit 和三进制权重,能够在笔记本电脑和 iPhone 等本地设备上实现高质量扩散推理,同时显著减少内存占用。

0 人收藏 0 人点赞
#open-weights

开源权重VLA在17个真实机器人任务中的4个上实现了80%以上的任务进度,零微调。附带演示视频。

Reddit r/singularity · 2026-05-31

发布Wall-OSS-0.5,一个开源权重的视觉-语言-动作模型,在17个真实机器人任务中的4个上实现了超过80%的任务进度,且无需微调,包括一个预训练中未见过的可变形绳索任务。该模型在提升具身接地能力的同时,保留了通用的视觉-语言能力。

0 人收藏 0 人点赞
#open-weights

G7就开源AI与开放权重AI的共同术语达成一致

Reddit r/artificial · 2026-05-30 缓存

G7数字与技术部长级会议就开源与开放权重AI的共同术语达成共识,定义了诸如“带开放数据的开源AI”、“开源AI”、“开放权重AI”和“权重可获取AI”等类别,以标准化围绕AI开放性的讨论。

0 人收藏 0 人点赞
#open-weights

ideogram-ai/ideogram-4-nf4

Hugging Face Models Trending · 2026-05-30 缓存

Ideogram 发布了 Ideogram 4,这是他们首个从头训练的开放权重文本生成图像模型,具备业界领先的多语言文字渲染能力、JSON 结构化提示词、边界框布局控制以及原生 2K 分辨率输出。NF4 量化版本已在 Hugging Face 上发布,该模型被认为是目前最优秀的开放权重图像模型,可与专有前沿模型相媲美。

0 人收藏 0 人点赞
#open-weights

@LangChain: LangSmith Signal的最新发现:开源模型正迎来高光时刻。每3个AI团队中就有1个在使用开源权重模型……

X AI KOLs Timeline · 2026-05-29 缓存

LangSmith Signal报告显示,如今每3个AI团队中就有1个在运行开源权重模型,而9个月前这一比例仅为1/5,整体使用量增长了3倍。

0 人收藏 0 人点赞
#open-weights

Step 3.7 Flash 开放权重今日发布,而智能体可靠性数据确实引人注目

Reddit r/artificial · 2026-05-29

Step 3.7 Flash 是一款开放权重的 198B 稀疏 MoE 模型,声称在 tau2-bench 上所有难度级别均达到 98% 的智能体可靠性,原始能力中等但多步一致性强劲。

0 人收藏 0 人点赞
#open-weights

@NielsRogge: StepFun 的令人印象深刻的发布,请访问 https://paperswithcode.co/paper/83892 探索

X AI KOLs Timeline · 2026-05-29 缓存

StepFun 发布了 Step 3.7 Flash,这是一个开放权重的模型,专为智能体、编程、搜索和多模态任务设计,在多个基准测试中取得了最高分。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈