面向理论物理研究的智能体框架

Reddit r/LocalLLaMA 2026/05/12 17:23 模型

摘要

Hugging Face 发布了“physics-intern”，这是一个用于理论物理研究的智能体框架。该框架使 Gemini 模型在 CritPt 基准测试上的性能翻倍，并与 GPT-5.5 Pro 相比达到了新的最先进水平。

大家好，在 Hugging Face，我们一直在为各个领域开发智能体框架，今天我们要发布 physics-intern，以解决理论物理领域的研究级问题。这是一个多智能体框架，旨在模拟研究过程，将工作分解为几项专注的任务，并分派给专用的子智能体（计算、审查声明、挑战研究策略等）。使用 physics-intern，我们成功使 Gemini 模型在 CritPt 基准测试上的性能翻倍，并与 GPT-5.5 Pro 等模型相比达到了新的最先进水平，同时成本显著降低 :) 我们在一篇博客文章中详细介绍了我们框架的构建过程，希望它能为社区进一步开发提供帮助：[https://huggingface.co/spaces/huggingface/physics-intern](https://huggingface.co/spaces/huggingface/physics-intern)

查看原文

面向理论物理研究的智能体框架

相似文章

@dlouapre: 认识一下 physics-intern，我们为理论物理打造的智能体框架。它使 Gemini 3.1 Pro 在 Crit… 上的成绩从 17.7% 提升至 31.4%。

@lvwerra：我们发布了physics-intern：一个用于科学问题的简单工具！它能让Gemini 3.1 Pro等模型的性能从17.7提升至…

@RoundtableSpace：Hugging Face 用智能体把整个后训练团队自动化了。它会读论文、跑 GPU 实验、反复迭代……

HarnessX：可组合、自适应且可演进的智能体夹具工坊

Gemini API 展示代理型 Gemini 模型

提交意见反馈