标签
来自Jeff Clune实验室的一篇论文描述了一个AI,它通过重写自己的源代码,在没有人工干预的情况下,使用进化方法,在SWE-bench上将编码能力从20%翻倍到50%。
本文讨论了大型语言模型的小缩放指数,认为它们在能源资源方面指示了一种不可持续的状态。还探讨了'pedestal effect',并类比流体湍流以评论数据的平滑性。
图灵奖得主理查德·萨顿在麻省理工学院发表71分钟演讲,批评当前人工智能发展现状,并主张通过自学、基于玩耍的抽象学习作为通往超级智能的路径。
OpenAI的GPT-5 Pro帮助免疫学家Derya Unutmaz解开了一个关于葡萄糖如何影响T细胞分化的三年之谜,它提出脱氧葡萄糖会干扰IL-2蛋白的构建,从而导致促炎性Th17细胞增加。
Chad Jones宣布将从6月30日起从斯坦福休假,加入Anthropic Institute,继续研究人工智能与经济未来。
一篇关于AI模型规模扩展趋势的分析,发布于LessWrong,时间跨度为2023年至2031年。
在FAIR工作4.5年后,一名研究员加入AMI Labs,致力于JEPA和World Models的研究。
李飞飞博士解释道,AI距离达到像牛顿、爱因斯坦或毕加索那样的创造性或科学天才还有很长的路要走。
亚利桑那州立大学的Subbarao Kambhampati教授及研究人员在一篇立场论文中提出,LLM中的思维链推理制造了一种推理假象,业界需要超越昂贵的token生成,转向替代推理机制。
清华大学语言处理实验室招募博士后、研究员和实习生,从事大模型前沿研究与开发,提供充足算力、数据、经费和具竞争力薪资,专注科研与开源。
AllenAI 发布 MolmoMotion,一种旨在基于短帧历史预测未来运动的视觉模型。
介绍了斯坦福提炼的提示词方法,通过整合外部信息模型(如Opus 4.8或5.5 Pro)生成矛盾地图进行辩论式分析,产出高可靠性且多视角的深度研究报告。
DeepSeek研究员陈德里开源了Deli AutoResearch SKILL,这是一份SKILL.md协议文件,定义了AI长期自主研究的运行规则,包括状态持久化、停滞检测、心跳机制等,旨在将自主科研从愿景拆解为可持续运行的工程化闭环。
研究人员使用32块H100 GPU训练了一个Deep Research智能体,并开源了所有组件,从而促进了社区访问和进一步开发。
Stanford REAP and CoPaper.AI have released Auto-Empirical Research Skills (AERS), an open-source toolkit with over 23,000 agent skills that automates the entire empirical research pipeline for social sciences, from topic selection to journal submission.
一篇比较RNNs、Transformers和SSMs中记忆设计的技术分析,主张关键问题在于序列状态应存储于何处,而非哪种架构更优。讨论了压缩隐状态、增长的KV缓存以及模型连接中类突触记忆之间的权衡。
Sam Altman宣布,以Transformer研究闻名的AI研究员Noam Shazeer在十年后加入OpenAI。