标签
Anthropic推出了Claude Science,这是一款用于科学研究的旗舰产品,能够自主执行计算生物学和药物开发中的任务,标志着该公司在人工智能应用于科学领域下了一个大赌注。
本文提出了一种概念与方法论框架,用于评估AI辅助研究中的证据许可声明,强调校准作为管理科学断言权利的机制,并区分不同的AI研究路径。
Anthropic推出了Claude Science,这是一款用于计算生物学和药物开发自主科学研究的新旗舰产品,所有付费Claude订阅用户均可使用。
探讨了在科学发现中验证人工智能生成假设的挑战——当不存在基准真相时如何应对,并介绍了Apodex的多智能体方法,即使用独立的验证智能体作为解决方案。
这篇立场论文认为,对AI的科学理解必须超越事后分析,转而研究塑造模型行为的训练动态,这对于预测、干预和设计训练过程以获取期望特性(如能力和安全性)具有重要意义。
《麻省理工科技评论》的新闻简报报道了三则重要故事:Anthropic的Code with Claude活动显示开发者越来越多地未经审核就直接部署AI编写的代码;即将举行的Enhanced Games允许运动员使用兴奋剂;以及Google I/O转向以代理型AI驱动科学,推出了Gemini for Science。
文章讨论了当前AI系统如何协助科学工作流程的部分环节,可能在数据丰富的领域加速渐进式发现,但仍受限于对现有文献和人类定义目标的依赖,存在认知同质化的风险。
Google I/O主题演讲强调了AI驱动科学的转变,将WeatherNext等专用工具与能够自主进行研究的智能体AI系统进行对比,标志着资源和热情的重新调整。
DeepMind的Co-Scientist人工智能工具融合了两位来自不同生物领域研究者的专业知识,通过生成可验证的假设并识别基于RNA的潜在治疗机制,加速ALS研究。
Tim O'Reilly 讨论了将AI整合到科学出版中的挑战,包括幻觉引用、已撤稿论文的传播以及在受损文献上进行训练,并呼吁调整现有的科学基础设施以用于AI。
Google DeepMind 宣布与大韩民国科学技术信息通信部建立战略合作关系,以支持国家 AI 战略和科学突破。该合作包括在首尔设立 AI Campus,为当地研究机构提供 AlphaFold 和 AlphaGenome 等先进模型的访问权限。
麻省理工学院(MIT)举办了一场探讨人工智能与数理科学未来的2025年研讨会,汇聚了顶尖研究人员,以探索这两个领域如何相互促进。生成的白皮书强调,人工智能与科学应建立双向互动关系:科学为人工智能的发展提供指导,而人工智能则助力科学发现。
OpenAI推出FrontierScience,这是一个新的基准测试,用于衡量人工智能在物理、化学和生物学领域的专家级科学能力。GPT-5.2在奥林匹克式任务中达到77%,在研究型任务中达到25%。该论文提供了早期证据,表明GPT-5能显著加速真实的科学工作流程,将工作周期从数周缩短至数小时,同时建立了度量标准,以追踪朝着AI加速科学研究的进展。
OpenAI在美国能源部所属的九个国家实验室组织了一场"1,000名科学家AI协作会议",汇聚了超过1,000名科学家,共同测试o3-mini等先进AI模型,以加速科学发现。该活动展示了一项重大的公私合作,旨在增强美国AI领导力,同时应对材料科学、可再生能源和天体物理学中的研究挑战。