标签
介绍了 TableVista,这是一个全面的基准测试,用于评估基础模型在视觉和结构复杂性下的多模态表格推理能力,包含 3,000 个问题,扩展为 30,000 个多模态样本。对 29 个模型的评估显示,在复杂布局和仅视觉设置下性能有所下降。
本综述论文全面回顾了大型基础模型中的视听智能,建立了统一的分类体系,综合了核心方法论,并概述了关键数据集、基准和开放性研究挑战。
探讨算力资源如何成为推动 AI 进步的核心驱动力,以及由此在能训练大模型的组织与仅限微调基础模型的组织之间形成的分化。
瑞士人工智能倡议于2023年12月启动,拥有超过1000万GPU小时和2000万瑞士法郎的资金,是一项重要的开放科学努力,旨在开发AI基础模型,涉及瑞士各机构的800多名研究人员。该倡议得到Alps超级计算机以及ETH和EPFL的协作支持,旨在为瑞士利益相关者提供透明的模型和数据集。
由MIT研究人员Tristan Bepler和Tim Lu创立的OpenProtein.AI,推出了一款无代码平台,旨在普及先进的AI蛋白质设计与工程模型,使广大生物学家都能便捷使用。
# 论文页面 - 单细胞CRISPR扰动的几何一致性揭示调控架构并预测细胞应激 来源:[https://huggingface.co/papers/2604.16642](https://huggingface.co/papers/2604.16642) ## 摘要 尽管基因组工程在序列层面已达成卓越精度,预测扰动后细胞将占据的转录组状态仍是未解难题。单细胞CRISPR筛选可测量细胞偏离未扰动状态的程度,但这一效应幅度忽略了一个根本问题:细胞是否协同移动?若一个扰动将细胞沿共同轨迹一致推进,而另一个将其分散到表达空间各处,即使幅度相同,结果也可能截然不同。
# 论文页面 - RoboLab:用于任务通用策略分析的高保真仿真基准 来源:[https://huggingface.co/papers/2604.09860](https://huggingface.co/papers/2604.09860) ## 摘要 RoboLab 是一个仿真基准框架,通过可扩展的真实任务生成和对策略在受控扰动下行为的系统分析,解决机器人策略评估中的局限。
National Robotics Week 期间,NVIDIA 重点展示了其在物理AI和机器人领域的突破,宣布了多项新技术,包括用于自然语言指令理解的NVIDIA Isaac GR00T开源模型、用于合成数据生成的Cosmos世界模型、Newton 1.0物理引擎,以及借助Isaac Sim 6.0和Isaac Lab 3.0扩展的仿真能力,从而加速机器人从训练到现实部署的开发进程。
英伟达CEO黄仁勋认为,AI的未来需要开放与专有模型作为协同编排系统共同发挥作用。英伟达宣布成立NVIDIA Nemotron Coalition,这是一个推动开源前沿模型发展的全球性合作计划,其基础模型由Mistral AI与NVIDIA联合开发。
DeepMind 发布 Genie 3,一个通用世界模型,能够从文本提示生成交互式环境,分辨率达 720p、帧率 24fps,相比前代版本具有更好的一致性和实时交互能力。
OpenAI 和加州大学伯克利分校举办的人工智能信任建立措施研讨会汇集了各方利益相关者,旨在制定策略以缓解基础模型带来的地缘政治风险,并确定了六项关键措施,包括危机热线、事件信息共享、模型透明度、内容溯源、红队测试和数据集共享。
OpenAI 推出了视频预训练(VPT),这是一种半监督方法,通过学习 70,000 小时的未标注人类游戏视频和少量标注数据集来训练神经网络玩 Minecraft。该模型使用原生人类界面(键盘和鼠标)学习复杂的序列任务,展示了制作钻石工具和柱子跳跃等能力,代表了朝向通用计算机使用代理的进步。