model-degradation

标签

Cards List
#model-degradation

@0xLogicrw: MiniMax 发布技术博客,披露其 M2 系列大模型无法输出人名「马嘉祺」的根因排查过程。排查从一个个例出发,最终揭示了一个波及整个词表近 5% 的系统性退化问题。 根本原因是大模型两个训练阶段的数据覆盖严重脱节。第一阶段(预训练)用海…

X AI KOLs Timeline · 15小时前

MiniMax 发布技术博客,深入分析其 M2 系列大模型在无法输出特定人名背后的系统性词表退化问题,揭示了预训练与后训练数据覆盖脱节导致的参数偏移,并提出了通过全量合成数据进行修复的有效方案。

0 人收藏 0 人点赞
#model-degradation

真实案例:“不跑在本地的模型就不是你的”——Gemma 4 碾压 ChatGPT 与 Gemini

Reddit r/LocalLLaMA · 2026-04-21

用户记录:闭源模型(GPT-4o→5.3、Gemini)在翻译中文小说时质量下滑并自我审查,而本地 Gemma 4 31B 不仅零审查,翻译质量也全面反超。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈