@lvwerra：我们发布了physics-intern：一个用于科学问题的简单工具！它能让Gemini 3.1 Pro等模型的性能从17.7提升至…

X AI KOLs Following 2026/05/21 15:01 工具

physics-intern harness science-problems reasoning-models subagent model-boosting

摘要

发布了physics-intern，一个简单工具，能显著提升Gemini 3.1 Pro等推理模型在科学问题上的性能，从17.7提升到31.4，超越了GPT 5.5 Pro。

我们发布了physics-intern：一个用于科学问题的简单工具！它能让Gemini 3.1 Pro等模型的性能从17.7提升至31.4，从而击败GPT 5.5 Pro。 physics-intern工具可以包装任何模型，并通过专门的子代理来提升基础推理模型的性能。虽然我认为这些工具所带来能力提升中的越来越多部分会被融入模型本身（就像提示技巧逐渐消失一样），但现在通过为这些模型构建良好的脚手架并良好集成工具，仍然可以收获很多。有趣的是，我们发现的例外是GPT 5.5 Pro实际上并没有从physics-intern工具中受益！在此了解更多：https://huggingface.co/spaces/huggingface/physics-intern… 附注：我觉得Harness[Model]这种表示法挺不错的。

查看原文

查看缓存全文

缓存时间: 2026/05/21 17:35

我们发布了 physics-intern：一个用于科学问题的简易框架！

它能让像 Gemini 3.1 Pro 这样的模型从 17.7 提升到 31.4，从而击败 GPT 5.5 Pro。

physics-intern 框架可以包装任何模型，并通过专用子代理提升普通推理模型的性能。

虽然我认为这些框架的能力增益会越来越多地被模型本身吸收（就像提示技巧随时间消失一样），但现在通过为这些模型构建良好的脚手架并很好地集成工具，我们可以获得很多收益。

有趣的是，我们发现 GPT 5.5 Pro 实际上并没有从 physics-intern 框架中受益！

更多详情请见：https://huggingface.co/spaces/huggingface/physics-intern…

P.S. 我觉得 Harness[Model] 这种表示法挺不错的。

physics-intern：一个用于物理学研究的自主智能体 - Hugging Face 空间由 huggingface 提供

来源：https://huggingface.co/spaces/huggingface/physics-intern 正在从 HF Docker 仓库获取元数据…

@lvwerra：我们发布了physics-intern：一个用于科学问题的简单工具！它能让Gemini 3.1 Pro等模型的性能从17.7提升至…

physics-intern：一个用于物理学研究的自主智能体 - Hugging Face 空间由 huggingface 提供

相似文章

@dlouapre: 认识一下 physics-intern，我们为理论物理打造的智能体框架。它使 Gemini 3.1 Pro 在 Crit… 上的成绩从 17.7% 提升至 31.4%。

面向理论物理研究的智能体框架

Gemini 3.1 Pro：专为最复杂任务打造的更智能模型

用GPT-5.2推进科学与数学

开始使用 Gemini 3 构建

提交意见反馈