@dlouapre: 认识一下 physics-intern,我们为理论物理打造的智能体框架。它使 Gemini 3.1 Pro 在 Crit… 上的成绩从 17.7% 提升至 31.4%。

X AI KOLs Following 工具

摘要

Physics-intern 是一个为理论物理设计的智能体框架,它将 Gemini 3.1 Pro 在 CritPt 基准测试上的表现从 17.7% 提升至 31.4%,达到了新的最优水平。

认识一下 physics-intern,我们为理论物理打造的智能体框架。它使 Gemini 3.1 Pro 在 CritPt(大语言模型最难的基准测试之一)上的成绩从 17.7% 提升至 31.4%,达到了新的最优水平。理论物理对人类和大语言模型而言都很难。但 physics-intern 能够分解问题并分派给一组专业智能体,从而比基础模型独自解决研究级问题有效得多。
查看原文

相似文章

面向理论物理研究的智能体框架

Reddit r/LocalLLaMA

Hugging Face 发布了“physics-intern”,这是一个用于理论物理研究的智能体框架。该框架使 Gemini 模型在 CritPt 基准测试上的性能翻倍,并与 GPT-5.5 Pro 相比达到了新的最先进水平。

使用 Gemini Deep Think 加速数学与科学发现

Google DeepMind Blog

DeepMind 宣布 Gemini Deep Think 具备解决数学、物理学和计算机科学领域专业研究问题的能力,其核心亮点在于全新智能体 "Aletheia",能够迭代式地验证和修正解决方案。

开始使用 Gemini 3 构建

Google DeepMind Blog

Google 发布了 Gemini 3 Pro,这是一款全新的 AI 模型,旨在编程、智能体工作流和多模态推理方面超越之前的版本。该模型可通过 Gemini API、Google AI Studio 以及全新的 Google Antigravity 开发平台使用。

Gemini 3 Deep Think:推动科学、研究与工程进步

Google DeepMind Blog

Google 发布了 Gemini 3 Deep Think 的重大更新,这是一种专门的推理模式,旨在通过将深厚的科学知识与实际应用相结合,解决科学、研究和工程领域的复杂挑战。