标签
微软发布MAI-Thinking-1训练技术细节:使用纯人类数据训练基座模型,然后训练三个领域专家模型,通过蒸馏将能力合并回基底模型,再经强化学习使模型能灵活运用不同能力。
推荐阅读MAI-Thinking-1的技术论文,其中详细介绍了训练SOTA大语言模型的几乎全部细节。
微软在 Build 2026 大会上发布了旗舰推理 AI 模型 MAI-Thinking-1,同时推出其他六款新模型,这标志着微软在自研模型开发上迈出了重要一步。