标签
对 pi-goal 工具进行源码解析和多模型实测,发现 DeepSeek V4 Pro 在长程任务上比 Gemini 3.5 Flash 便宜 31 倍且质量更高,且更高思考模式反而导致幻觉增加。