标签
分享了一个由 ModelScope 维护的开放共建仓库 Awesome Vibe Research,该仓库收集并沉淀了科研全流程中可复用、可验证、可演化的 AI 辅助组件,包括智能体、技能包、工作流、工具和最佳实践,旨在帮助科研人员和开发者利用 AI 提升研究效率。
本文提出,AI辅助社会科学研究的可靠性取决于决策架构——即认知劳动在人类与机器之间的分工方式。通过一个预先指定的析因实验,作者表明,一个无约束的多智能体基线在72%的运行中失败,而采用三个架构承诺(限制LLM仅进行推理、确定性数据/估计、以及三个人类决策门控)的组织运行失败率仅为16%。
# Bolzano:LLM辅助数学研究的案例研究 来源:[https://arxiv.org/html/2604.16989](https://arxiv.org/html/2604.16989) Jan Grebík1、Pavel Hubáček1,2、Martin Koutecký1、Matěj Kripner3、Václav Rozhoň1、Robert Šámal1、Adrián Zámečník1 1 布拉格查理大学计算机科学研究所 2 捷克科学院数学研究所 3 布拉格查理大学形式与应用语言学研究所 ###### 摘要 我们报告了在数学与理论计算机科学领域六个问题上取得的新成果……
GPT-5.2 协助推导出一个新的理论物理学结果,表明在特定半共线动量条件下,单负胶子树图振幅可以非零,挑战了粒子物理学中数十年的假设。该AI模型识别了复杂费曼图表达式中的模式,并推测出一个通用公式,随后通过形式化证明得到了验证。