@jakevin7: DeepSeek V4 的"Think Max"模式,本质就是在 prompt 开头加了一句"你必须把每一步都想清楚,不许走捷径" 所以推理能力到底是涌现的,还是……被骂出来的?

X AI KOLs Following 新闻

摘要

DeepSeek V4的"Think Max"模式实际上只是在prompt开头添加了要求逐步思考的指令,引发了对推理能力来源的讨论。

DeepSeek V4 的"Think Max"模式,本质就是在 prompt 开头加了一句"你必须把每一步都想清楚,不许走捷径" 所以推理能力到底是涌现的,还是……被骂出来的?
查看原文
查看缓存全文

缓存时间: 2026/06/08 15:22

DeepSeek V4 的“Think Max“模式,本质就是在 prompt 开头加了一句“你必须把每一步都想清楚,不许走捷径“

所以推理能力到底是涌现的,还是……被骂出来的?

相似文章

@karminski3: 魔法! DeepSeekV4 上下文内存压缩到1/10! 大家都知道 DeepSeekV4 是支持1M上下文的, 而且经过了极度优化, 如果要真的用到1M上下文, 显存占用只需要10G左右, (对比之下 DeepSeek-V3.2 大概需…

X AI KOLs Following

FlashMemory-DeepSeek-V4提出了一种名为Lookahead Sparse Attention(LSA)的新型推理范式,通过神经内存索引器主动预测未来上下文需求,将物理KV缓存占用压缩至全上下文基线的13.5%,同时平均精度提升0.6%。该方法采用解耦训练策略,无需加载基座模型即可独立训练索引器,显著降低训练成本。