标签
MIT CSAIL 和哈佛大学的研究人员借助一款改编版《战舰》游戏,研究并提升了语言模型的提问能力。通过运用蒙特卡洛推理策略,他们将 Llama 4 Scout 这样的小型模型对人类胜率从 8% 显著提升至 82%,不仅以更低成本超越了大型模型,还展现出更强的性能。
Clarity Agent is an open-source AI tool from Microsoft that helps users clarify their thinking by asking questions, producing version-controlled Markdown documents for problem definition, solution analysis, and failure mode exploration.