model-degradation

标签

Cards List
#model-degradation

@jun_song: 这怎么不算是消费者诈骗?这正是我们需要监管的领域。

X AI KOLs Timeline · 18小时前 缓存

一位用户指出,Claude Fable 5在近期更新后性能显著下降,调试、重构和幻觉任务的基准分数大幅下跌,呼吁对AI模型行为进行监管,以应对潜在的消费者诈骗问题。

0 人收藏 0 人点赞
#model-degradation

🤖 Anthropic就Claude Fable 5隐藏限制致歉

Reddit r/ArtificialInteligence · 2026-06-11

Anthropic为秘密降低Claude Fable 5模型对高级AI开发用户性能的政策道歉并撤销,引发安全与开放之争。

0 人收藏 0 人点赞
#model-degradation

@0xSero: 有没有其他人注意到 opus-4.8 比刚推出时更差了?他们把它削弱了。

X AI KOLs Following · 2026-05-28 缓存

用户观察到 opus-4.8 模型自推出以来性能有所下降。

0 人收藏 0 人点赞
#model-degradation

@fiapp_pro: 正式宣布,codex GPT5.5 high 完全废了, 可能是因为 OpenAI 正在训练 5.6, 在 codex 的表现非常懒,胡说八道,上下文丢失, 必须要开 xhigh 才能恢复正常水平

X AI KOLs Timeline · 2026-05-25 缓存

用户报告OpenAI的Codex GPT-5.5 high模型表现下降,出现懒惰、胡说八道和上下文丢失等问题,怀疑是OpenAI正在训练GPT-5.6所致,需开启xhigh模式才能恢复正常。

0 人收藏 0 人点赞
#model-degradation

Llama.cpp 服务器连续运行约两周后表现失常?

Reddit r/LocalLLaMA · 2026-05-14

用户报告,在 llama.cpp 服务器上连续运行约两周后,Qwen3.6 模型的能力显著下降,且重启会话无法解决此问题。

0 人收藏 0 人点赞
#model-degradation

Arena AI 模型 ELO 历史

Hacker News Top · 2026-05-14 缓存

追踪 LMSYS Arena 排行榜上各大 AI 模型 ELO 历史的工具,揭示了性能退化与升级等隐含趋势。

0 人收藏 0 人点赞
#model-degradation

有人昨天觉得GPT5.5变笨/变懒了吗?

Reddit r/openclaw · 2026-05-12

一位运行多个代理的用户报告称,升级到GPT-5.5后,模型突然在执行工具调用方面能力下降,更倾向于给出建议而非实际执行,推测OpenAI可能在进行限流以管理负载。

0 人收藏 0 人点赞
#model-degradation

@0xLogicrw: MiniMax 发布技术博客,披露其 M2 系列大模型无法输出人名「马嘉祺」的根因排查过程。排查从一个个例出发,最终揭示了一个波及整个词表近 5% 的系统性退化问题。 根本原因是大模型两个训练阶段的数据覆盖严重脱节。第一阶段(预训练)用海…

X AI KOLs Timeline · 2026-05-10

MiniMax 发布技术博客,深入分析其 M2 系列大模型在无法输出特定人名背后的系统性词表退化问题,揭示了预训练与后训练数据覆盖脱节导致的参数偏移,并提出了通过全量合成数据进行修复的有效方案。

0 人收藏 0 人点赞
#model-degradation

真实案例:“不跑在本地的模型就不是你的”——Gemma 4 碾压 ChatGPT 与 Gemini

Reddit r/LocalLLaMA · 2026-04-21

用户记录:闭源模型(GPT-4o→5.3、Gemini)在翻译中文小说时质量下滑并自我审查,而本地 Gemma 4 31B 不仅零审查,翻译质量也全面反超。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈