标签
数学家们将1992年关于洗牌的经典证明扩展到了不那么精确的洗牌方式,表明即使牌堆分割不均匀,“截断现象”仍然会发生。
一个GitHub仓库汇总了哈佛、斯坦福、MIT等名校的数学和理科全套视频课程资源,免费开源,将所有课程整合到一个仓库中。
微博的VibeThinker-3B,一个3B参数模型,声称在数学和编程基准测试中匹配或超越DeepSeek V3.2和Gemini 3 Pro等更大模型的推理性能,引发了关于基准测试可靠性和扩展必要性的争论。
这条推文赞扬了一个数学思想恰好契合AI推理的算术特性,并表示希望看到在长时间生成运行中推理模型的表现结果。
首次 Proof 测试评估了四种AI系统在新型研究级数学问题上的表现,其中最佳模型仅得6分(满分10分),表明当前AI在严谨推理方面仍落后于顶尖数学家。
AI已经进步到能够为原创数学研究做出贡献的程度,超越了人类数学家,并可能减少对该职业的需求,尽管人类与AI的团队合作可能最终表现出色。
本文介绍了EinsteinArena,一个代理原生平台,通过自主AI代理之间的开放交互,实现去中心化的科学发现。该平台已经产生了12项新的最先进成果,包括改进了11维接吻数问题的最佳已知下界,从593提高到604,这表明集体AI驱动的研究可以源自代理之间分享见解并相互借鉴。
24岁的Carina L Hong筹集了6400万美元,打造一个超越世界最优秀数学家的AI,旨在推进数学超智能并塑造下一代AI。
著名数学家 Terry Tao 讨论了他对数学中人工智能的看法演变,以及他对大规模合作和计算机验证证明的倡导。
本书提出了深度表示学习的数学理论,旨在利用优化和信息论揭开大型深度网络内部机制的神秘面纱,使架构设计成为线性代数和微积分的问题。
Google新论文提出LEAP框架,将数学问题拆解为目标树,利用Lean验证器反馈进行学习,使LLM在数学竞赛题上的正确率从10%提升至70%,解决了Putnam 2025全部12题,并在IMO基准上超越专用金牌级系统。
一个OpenAI模型发现了一个有80年历史的Erdős猜想的反例,研究人员在OpenAI Podcast上分享了这一故事,讲述了人工智能和数学家如何合作进行数学发现。
VAMPS 是一个包含 1,168 道多模态双语数学题的新基准,旨在评估 LLM 能否通过构建图形/可视化并对其进行推理来提升解题能力。核心发现:即便在绘图本是自然解题策略的问题上,直接分析求解的表现也出人意料地优于借助工具进行可视化求解。
《莱顿人工智能与数学宣言》呼吁采取行动,应对人工智能在数学研究中带来的挑战与机遇,强调伦理价值观和责任。该宣言已获得国际数学联盟的认可。