open-weight

标签

Cards List
#open-weight

@rasbt:又一个开源权重发布。Nemotron 3 Ultra 拥有令人印象深刻的性能效率比!在设计上,它……

X AI KOLs Timeline · 2026-06-04 缓存

Nemotron 3 Ultra 是一个开源权重发布,具有令人印象深刻的性能效率比,采用 Mamba-2 与注意力机制的混合栈和 LatentMoE,并且比之前的 Super 变体更大。

0 人收藏 0 人点赞
#open-weight

Ideogram 4.0

Product Hunt · 2026-06-04

Ideogram 4.0 作为一个具有布局控制的开放权重模型发布,用于生成设计就绪的图像。

0 人收藏 0 人点赞
#open-weight

Ideogram 4 (GitHub 仓库)

TLDR AI · 2026-06-04

Ideogram 4 是一个从零开始训练的开放权重的文生图模型,支持结构化 JSON 提示、业界最佳的多语言文本渲染、边界框布局控制、调色板控制以及原生 2K 分辨率输出。

0 人收藏 0 人点赞
#open-weight

@rasbt: 有一阵子了!开源权重本地大模型(可在消费级硬件上运行)生态系统的4个不错的新增内容:

X AI KOLs Timeline · 2026-06-03 缓存

Sebastian Raschka 介绍了近期可在消费级硬件上运行的开源权重本地大语言模型生态系统的四项新增内容。

0 人收藏 0 人点赞
#open-weight

MiniMax 承诺在发布百万上下文模型后公开 M3 权重(2 分钟阅读)

TLDR AI · 2026-06-03 缓存

MiniMax 通过 API 发布了 M3,这是一款拥有 100 万 token 上下文窗口并支持原生多模态输入的模型。该公司承诺在 10 天内发布开源权重和技术报告。

0 人收藏 0 人点赞
#open-weight

JetBrains 的 Mellum 2(阅读时间 49 分钟)

TLDR AI · 2026-06-02 缓存

JetBrains 发布 Mellum 2,这是一个 12B 参数的开源权重混合专家语言模型,专注于软件工程领域,在代码生成、推理和工具使用方面性能具有竞争力,基于 Apache 2.0 许可证发布。

0 人收藏 0 人点赞
#open-weight

@_djdumpling: Luke 是在 RL 基础设施方面最出色的人之一,绝对值得一读!

X AI KOLs Timeline · 2026-06-01 缓存

Luke J. Huang 的新博客文章调研了异步强化学习理论与基础设施,涵盖 8 家开放权重前沿实验室,并讨论了算法技术以及针对训练-推理不匹配的系统修复方案。

0 人收藏 0 人点赞
#open-weight

MiniMax M3 - 编码与智能体前沿,百万级上下文,多模态

Reddit r/LocalLLaMA · 2026-06-01 缓存

MiniMax 发布了 M3,这是一个开源权重模型,具备前沿编码能力、智能体能力、百万级上下文和原生多模态能力,在编码和智能体任务上取得了顶级基准成绩,并支持自主任务分解和长上下文。

0 人收藏 0 人点赞
#open-weight

@Miles_Brundage: 我不确定是否见过对蒸馏缩小这一差距的程度有好的分析——人们对此有截然不同的看法……

X AI KOLs Timeline · 2026-05-30 缓存

Miles Brundage 评论说,关于蒸馏如何影响开源权重与专有AI模型之间的能力差距,目前缺乏定量分析,并引用了Epoch AI的说法,即开源权重模型落后四个月。

0 人收藏 0 人点赞
#open-weight

@EpochAIResearch:我们重新审视了开源权重模型与专有模型之间的能力差距。自年初以来,开源权重模型一直比最先进水平落后约四个月...

X AI KOLs Following · 2026-05-29 缓存

Epoch AI Research 分析了开源权重模型与专有模型之间的能力差距,发现自年初以来,开源权重模型一直比最先进水平落后约四个月。

0 人收藏 0 人点赞
#open-weight

Mellum2 技术报告

Hugging Face Daily Papers · 2026-05-29 缓存

Mellum 2 是一个由 JetBrains 开发的 12B 参数开源权重的 MoE 语言模型,具有 2.5B 活跃参数,专注于软件工程任务,并针对商用 GPU 上的高效推理进行了优化。

0 人收藏 0 人点赞
#open-weight

NuExtract3发布:面向Markdown、OCR和结构化提取的开放权重4B视觉语言模型(可自行托管)[P]

Reddit r/MachineLearning · 2026-05-22

Numind发布了NuExtract3,这是一个基于Qwen3.5-4B的4B开放权重视觉语言模型,专为将文档图像转换为Markdown、OCR和结构化数据提取而设计。该模型采用Apache-2.0许可证,可自行托管,并提供量化版本以适应低显存环境。

0 人收藏 0 人点赞
#open-weight

等待 Qwen 3.7 开源权重… 新王者已至…

Reddit r/LocalLLaMA · 2026-05-21

Qwen 3.7 开源权重模型已发布,在 AI 社区中引起巨大轰动,成为全新的顶级模型。

0 人收藏 0 人点赞
#open-weight

Stable Audio 3.0(3分钟阅读)

TLDR AI · 2026-05-21 缓存

Stability AI发布了Stable Audio 3.0,这是一个开放权重模型系列,可生成最长六分钟的变长音频,支持LoRA微调和音频修复,基于完全许可的数据训练。

0 人收藏 0 人点赞
#open-weight

@thepatch_kev:有些AI音乐模型实际上是专为音乐人打造的,Stable Audio 3就是一个很好的例子。感谢 @z…

X AI KOLs Following · 2026-05-20 缓存

Stability AI 发布了 Stable Audio 3.0,这是一个用于生成音频的开放权重模型系列,旨在支持艺术实验并集成到 gary4juce 等 DAW 中。

0 人收藏 0 人点赞
#open-weight

MiroThinker-1.7,一款开放权重的深度研究代理(基于Qwen3 MoE)——迷你版为30B/3B激活参数,好奇大家在消费级硬件上能达到多少tok/s

Reddit r/LocalLLaMA · 2026-05-17

MiroThinker-1.7 是一款基于 Qwen3 MoE 构建的开放权重深度研究代理,其迷你版(总计30B参数,激活3B参数)专为消费级硬件设计;团队分享了基准测试结果,并寻求关于本地部署的反馈。

0 人收藏 0 人点赞
#open-weight

@jerryjliu0:一组新的开源权重模型正在登顶文档理解排行榜,INF 刚刚发布了两个模型:Inf…

X AI KOLs Following · 2026-05-15 缓存

Infinity 发布了两个开源权重模型,Infinity-Parser2-Pro(35B)和 Infinity-Parser2-Flash(2B),它们登顶了 ParseBench 文档理解排行榜,利用了合成数据引擎和一种新颖的联合强化学习算法。

0 人收藏 0 人点赞
#open-weight

@svpino:首次,我觉得开源权重模型已无法忽视。我们正处于这些模型具有竞争…

X AI KOLs Following · 2026-05-15

Santiago (@svpino) 强调 MiniMax-M2.7,一个 230B 参数的开源权重模型,能与 Opus 4.6 和 GPT-5.4 等顶级专有模型相抗衡,在 SambaNova 上以低成本实现 440+ tokens/s 的推理速度。

0 人收藏 0 人点赞
#open-weight

@poolsideai:Poolside 正在伦敦举办为期两天的模型研究黑客松。加入我们,尽可能推动开源权重智能体模型的发展……

X AI KOLs Following · 2026-05-13

Poolside 正在伦敦举办为期两天的模型研究黑客松,旨在利用强化学习和在 Laguna XS.2 上的微调,进一步推动开源权重智能体模型的发展。合作伙伴包括 NVIDIA、Prime Intellect 和 Hugging Face,奖品为 NVIDIA DGX Spark。

0 人收藏 0 人点赞
#open-weight

HEBATRON:一款专攻希伯来语的开权重大语言模型

arXiv cs.CL · 2026-05-13 缓存

Hebatron 是一款基于 NVIDIA Nemotron-3 混合专家(MoE)架构构建的、专攻希伯来语的新开源权重大型语言模型。该模型在实现高效推理的同时展现出强大的推理能力。它是首个针对该架构进行的语言特定适配版本,并支持原生长上下文处理。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈