标签
PSI正在建设一个垂直整合的物理超级智能工厂,旨在通过人工超级智能加速物理学突破,并开源了一款面向物理学家的AI助手“Get Physics Done(GPD)”。
OpenAI的GPT-5 Pro帮助免疫学家Derya Unutmaz解开了一个关于葡萄糖如何影响T细胞分化的三年之谜,它提出脱氧葡萄糖会干扰IL-2蛋白的构建,从而导致促炎性Th17细胞增加。
NatureBench是一个跨学科基准测试,包含来自《自然》出版物的90个科学任务,旨在评估AI编码代理实现真正发现的能力。当前代理主要通过方法转化而非科学创新取得成功。
NVIDIA宣布推出新的AI软件库和微服务——DAQIRI、ALCHEMI和cuPhoton——大幅加速天文学、材料科学和粒子物理等领域的科学计算任务,相比基于CPU的流水线可实现高达14,900倍的加速。
Oswald Steward及其同事因发现神经元可在突触附近产生蛋白质而获得2026年卡夫利神经科学奖,这一发现从根本上改变了人们对记忆和大脑可塑性的理解。
一篇介绍AI科学家(The AI Scientist)的论文,该系统自动化了从想法生成到同行评审的整个研究生命周期,展示了人工智能在科学贡献方面日益增长的能力。
THU Team Eureka 开源了 EurekAgent,这是一个基于 Claude Code 构建的自主研究系统,通过环境工程在数学、内核工程和机器学习任务上取得了最先进的结果。
文章认为,现实生活中的外星生命揭露很可能是一个渐进、科学的过程,类似于发现希格斯玻色子,而不是 Steven Spielberg 新电影中描绘的戏剧性电影揭示,并引用了最近的UAP听证会和缺乏确凿证据的情况。
介绍SciAgentArena,一个约200个任务的基准测试,用于评估真实科学研究中的AI智能体。发现智能体在明确指定的数据分析工作流程中表现有效,但在产生新颖见解和开放式探索方面存在困难。
介绍StatefulDiscovery,一个用于开放端科学发现的框架,它利用外部化的调查状态来校准证据和主张,在生成得到充分支持的高价值主张方面优于基线方法。
本文介绍了EinsteinArena,一个代理原生平台,通过自主AI代理之间的开放交互,实现去中心化的科学发现。该平台已经产生了12项新的最先进成果,包括改进了11维接吻数问题的最佳已知下界,从593提高到604,这表明集体AI驱动的研究可以源自代理之间分享见解并相互借鉴。
本文提出了一种受并行回火启发的进化框架,该框架利用多温度采样和信息交换,提高了大语言模型生成科学假设的多样性和质量,并在分子发现、方程发现和算法发现等领域中得到了验证。
介绍SciTrace框架,该框架通过安全内禀推理循环和组合工具链验证器,将安全推理融入科学代理流程的每一个阶段,在保持输出质量的同时实现了最先进的安全性。
EditSR 提出了一种双层框架,将神经符号回归模型与基于编辑的修正器(Rectifier)相结合,以高效修正生成表达式中的结构错误,减少错误累积,并以有限的额外成本提高复杂符号结构的恢复能力。
本文介绍了一个范畴论框架,用于区分自我改进的AI智能体中的真正科学发现与单纯的检索或搜索,利用范畴论来形式化状态转变。作者通过一个蛋白质力学示例展示了该框架:智能体在解决更难的问题时准确率下降,但其理论压缩了更多数据,表明真正的发现。
本文讨论了一篇新的MIT论文,提出了一种自进化AI科学家的框架,该框架能够识别当前模型的不足并引入新的科学概念,区分了检索、搜索和发现。
宣布将在旧金山举办的COLM 2026上举行LLMs for Scientific Discovery研讨会,论文提交截止日期为6月23日,并招募评审人员。
MIT的研究人员发表了一篇关于自进化人工智能科学家的论文,这些科学家能够发现并调整自己的科学词汇,利用范畴论框架数学量化真正的创新,并将发现与单纯的搜索或检索区分开来。
一个OpenAI模型发现了一个有80年历史的Erdős猜想的反例,研究人员在OpenAI Podcast上分享了这一故事,讲述了人工智能和数学家如何合作进行数学发现。
Google DeepMind 已开源 Science Skills,这是一套针对基因组学、结构生物学和化学信息学等科研任务的智能体技能集合,旨在以科学依据和更高的令牌效率加速智能体工作流程。