mai-thinking-1

#mai-thinking-1

@Datou: 微软还是爱惜羽毛的，刻意避开合成数据，只用人类数据训练出一个 base 模型，然后一生三，训练三个不同领域的专家模型，然后自己蒸馏自己，把三种能力蒸回 bese 模型（权重配比很考验经验），再强化学习一轮让蒸馏模型懂得看问题下菜碟灵活运用…

X AI KOLs Timeline ↗ · 2026-06-02 缓存

微软发布MAI-Thinking-1训练技术细节：使用纯人类数据训练基座模型，然后训练三个领域专家模型，通过蒸馏将能力合并回基底模型，再经强化学习使模型能灵活运用不同能力。

0 人收藏 0 人点赞

#mai-thinking-1

X AI KOLs Timeline ↗ · 2026-06-02 缓存

推荐阅读MAI-Thinking-1的技术论文，其中详细介绍了训练SOTA大语言模型的几乎全部细节。

0 人收藏 0 人点赞

#mai-thinking-1

The Verge ↗ · 2026-06-02 缓存

微软在 Build 2026 大会上发布了旗舰推理 AI 模型 MAI-Thinking-1，同时推出其他六款新模型，这标志着微软在自研模型开发上迈出了重要一步。

0 人收藏 0 人点赞