标签
Maka的Harness工程通过改进self-check机制,使DeepSeek Flash V4在terminal-bench样本集上达到接近GLM-5.2的评测效果,仅用4元人民币和97.5%的缓存命中率完成10道编程Agent任务。