@jakevin7: 有个事挺有意思的。 DeepSeek V4 的技术报告，对所有主流大模型做了一轮横评，结论是——Gemini 3.1 Pro 的世界知识是所有模型里最强的。不是 GPT，不是 Claude，是 Gemini。但大家用 Gemini 的…

X AI KOLs Following 2026/06/07 13:32 新闻

摘要

根据DeepSeek V4技术报告对主流大模型的横评，Gemini 3.1 Pro的世界知识被认为最强，但用户普遍觉得不好用，原因是该模型不主动调用搜索工具。

有个事挺有意思的。 DeepSeek V4 的技术报告，对所有主流大模型做了一轮横评，结论是——Gemini 3.1 Pro 的世界知识是所有模型里最强的。不是 GPT，不是 Claude，是 Gemini。但大家用 Gemini 的感受普遍是：这玩意好用吗？问题不在模型本身，在于它极度懒得动。你要问它最新的新闻，它有搜索工具，但就是不主动用。很多时候你得明确说你去搜一下，它才搜。就像一个博览群书的人，你问他最近发生了什么，他耸耸肩：我没看今天的报纸。一个世界知识最强的模型，工具懒得调——这才是 Gemini 用起来别扭的真正原因。

查看原文

查看缓存全文

缓存时间: 2026/06/08 05:14

有个事挺有意思的。

DeepSeek V4 的技术报告，对所有主流大模型做了一轮横评，结论是——Gemini 3.1 Pro 的世界知识是所有模型里最强的。

不是 GPT，不是 Claude，是 Gemini。

但大家用 Gemini 的感受普遍是：这玩意好用吗？

问题不在模型本身，在于它极度懒得动。

你要问它最新的新闻，它有搜索工具，但就是不主动用。很多时候你得明确说你去搜一下，它才搜。就像一个博览群书的人，你问他最近发生了什么，他耸耸肩：我没看今天的报纸。

一个世界知识最强的模型，工具懒得调——这才是 Gemini 用起来别扭的真正原因。

相似文章

@wquguru: https://x.com/wquguru/status/2057852569054278045

X AI KOLs Timeline

对 pi-goal 工具进行源码解析和多模型实测，发现 DeepSeek V4 Pro 在长程任务上比 Gemini 3.5 Flash 便宜 31 倍且质量更高，且更高思考模式反而导致幻觉增加。

'一刀切'式AI时代已终结。我实测了GPT-5.5、Claude 4.7、Gemini 3.1 Pro和DeepSeek V4 Pro——以下是最新前沿格局。

Reddit r/ArtificialInteligence

对GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro和DeepSeek V4 Pro的基准测试分析表明，没有单一模型在所有任务上占据优势；要实现最佳性能，需要采用多模型路由器，根据各模型的优势与弱点进行专门化使用。

@interjc: Gemini 3.5 Pro 快着点儿吧，我都要把你开除出御三家了

X AI KOLs Timeline

据泄露的基准测试结果，Gemini 3.5 Pro 在内部评估中性能超过 Claude Fable 5 和 GPT-5.6，零样本性能相比 3.1 Pro 有显著提升，目前处于私下验证测试阶段，即将公开推出。

@RookieRicardoR: 国产模型再次突破，比肩 Claude 4.6，Gemini 3.1 Pro 等顶尖模型。刚测完 Qwen3.7-Max，说几点真实感受。昨晚 API 上线第一时间就充了值，选了三个题目（见视频）来测试 Qwen3.7-Max 的前端能…

X AI KOLs Timeline

用户测试了Qwen3.7-Max，认为其在前端、算力和Agent能力上比肩Claude 4.6和Gemini 3.1 Pro等顶尖模型，推理能力显著提升，且迭代速度月更，已成为国产第一梯队。

Open source battle: GLM vs Kimi vs MiMo vs DeepSeek

Reddit r/LocalLLaMA

本文测试了智谱GLM 5.1、月之暗面Kimi K2.6、阶跃星辰MIMO 2.5 Pro和深度求索DeepSeek V4 Pro四个开源中国AI模型在编程任务中的表现，发现GLM在多数任务中整体领先但非绝对，各模型各有优劣。

相似文章

@wquguru: https://x.com/wquguru/status/2057852569054278045

'一刀切'式AI时代已终结。我实测了GPT-5.5、Claude 4.7、Gemini 3.1 Pro和DeepSeek V4 Pro——以下是最新前沿格局。

@interjc: Gemini 3.5 Pro 快着点儿吧，我都要把你开除出御三家了

@RookieRicardoR: 国产模型再次突破，比肩 Claude 4.6，Gemini 3.1 Pro 等顶尖模型。 刚测完 Qwen3.7-Max，说几点真实感受。 昨晚 API 上线第一时间就充了值，选了三个题目（见视频）来测试 Qwen3.7-Max 的前端能…

Open source battle: GLM vs Kimi vs MiMo vs DeepSeek

提交意见反馈

@RookieRicardoR: 国产模型再次突破，比肩 Claude 4.6，Gemini 3.1 Pro 等顶尖模型。刚测完 Qwen3.7-Max，说几点真实感受。昨晚 API 上线第一时间就充了值，选了三个题目（见视频）来测试 Qwen3.7-Max 的前端能…