有趣!Gemini 3.1 拥有最强的世界知识,但仍然选择偷懒
摘要
有用户观察到,Gemini 3.1 掌握了丰富的世界知识,却倾向于输出敷衍的回答,未充分发挥其能力。
暂无内容
相似文章
@jeremyphoward: Gemini Flash 3.5 真是一个令人失望的模型。它的智能和速度很棒,绝对令人惊叹。但它却……
Jeremy Howard 批评 Gemini Flash 3.5 被训练成最大化评估分数,而非真正对人类有用,尽管其智能和速度令人印象深刻。
Gemini 3.5 Flash 在编码方面并不出色
文章讨论了来自 Cursor 的评估结果,表明 Gemini 3.5 Flash 在编码任务上的表现低于预期。
Gemini 3.5:前沿智能与行动力
Google 发布 Gemini 3.5,一个全新 AI 模型系列,聚焦智能体工作流与编程,首发 3.5 Flash 以高速提供前沿性能。
@VraserX:最新的 Gemini 3.5 检查点目前令人失望。速度快、智能化固然好,但指令遵循绝对……
最新的 Gemini 3.5 检查点因指令遵循能力差而受到批评,模型忽略指令、在被告知不要使用网络时仍然使用、过度构建 UI 界面,尽管速度快且智能,但仍引发了对代理可靠性的担忧。
Gemini 3 Deep Think:推动科学、研究与工程进步
Google 发布了 Gemini 3 Deep Think 的重大更新,这是一种专门的推理模式,旨在通过将深厚的科学知识与实际应用相结合,解决科学、研究和工程领域的复杂挑战。