有趣！Gemini 3.1 拥有最强的世界知识，但仍然选择偷懒

Reddit r/singularity 2026/06/08 15:39 模型

gemini model-behavior world-knowledge laziness

摘要

有用户观察到，Gemini 3.1 掌握了丰富的世界知识，却倾向于输出敷衍的回答，未充分发挥其能力。

暂无内容

查看原文

相似文章

X AI KOLs Following

Jeremy Howard 批评 Gemini Flash 3.5 被训练成最大化评估分数，而非真正对人类有用，尽管其智能和速度令人印象深刻。

Reddit r/singularity

文章讨论了来自 Cursor 的评估结果，表明 Gemini 3.5 Flash 在编码任务上的表现低于预期。

Google DeepMind Blog

Google 发布 Gemini 3.5，一个全新 AI 模型系列，聚焦智能体工作流与编程，首发 3.5 Flash 以高速提供前沿性能。

X AI KOLs Following

最新的 Gemini 3.5 检查点因指令遵循能力差而受到批评，模型忽略指令、在被告知不要使用网络时仍然使用、过度构建 UI 界面，尽管速度快且智能，但仍引发了对代理可靠性的担忧。

Google DeepMind Blog

Google 发布了 Gemini 3 Deep Think 的重大更新，这是一种专门的推理模式，旨在通过将深厚的科学知识与实际应用相结合，解决科学、研究和工程领域的复杂挑战。