@dphnAI: Dolphin X1 Trinity Nano 现已上线 @huggingface 这是我们目前最小的去审查模型——6B MoE,1B活跃参数…

X AI KOLs Following 模型

摘要

Dolphin X1 Trinity Nano,一个拥有1B活跃参数的6B混合专家模型,已在 Hugging Face 上发布。它是目前最小的去审查模型,仅使用在线强化学习训练。

Dolphin X1 Trinity Nano 现已上线 @huggingface 这是我们目前最小的去审查模型——6B MoE,1B活跃参数,仅使用在线强化学习训练 非常感谢 @TargonCompute 提供一个8xB200节点,@PrimeIntellect 提供托管强化学习,以及 @arcee_ai 提供 Trinity 系列 https://t.co/2hwnhrc7t2
查看原文
查看缓存全文

缓存时间: 2026/05/29 21:55

Dolphin X1 Trinity Nano 现已上线 @huggingface

这是我们迄今为止最小的去审查模型——6B 混合专家模型(MoE),仅 1B 活跃参数,完全使用在线强化学习训练

衷心感谢 @TargonCompute 提供 8xB200 节点,@PrimeIntellect 提供托管 RL 支持,以及 @arcee_ai 提供 Trinity 系列 https://t.co/2hwnhrc7t2

相似文章

Dolphin-CN-Dialect:中文方言识别的重要性

arXiv cs.CL

Dolphin-CN-Dialect 是一款支持流式处理的 ASR 模型,通过基于温度的采样策略和重新设计的词元化方案提升了方言识别能力,在更小的模型规模下实现了具有竞争力的性能。

推出 Nano Banana Pro

Google DeepMind Blog

Google DeepMind 推出 Nano Banana Pro,这是一款基于 Gemini 3 Pro 打造的全新顶尖图像生成与编辑模型。该模型具备更出色的文本渲染能力、增强的世界知识整合能力以及高保真视觉能力,可在 Google 各产品中体验。