标签
SimWorlds是一个多智能体框架,能够通过自然语言生成动态、可编辑的4D场景。它利用Blender特定的程序化知识以及规划-编码-审查工作流,性能优于先前基线。
本文介绍了一份详细的基准测试,比较了 JavaScript 中用于二维物理模拟的 ECS 和 OOP 架构,测试了内存局部性和多维性能,包括 broad-phase 算法和排序策略,结果基于 M4 Mac。
对四个 AI 模型(Fable 5、Opus 4.8、GLM 5.2、GPT 5.5)生成 HTML5 Canvas 物理演示的比较显示,Fable 5 在质量上优于其他模型,但每次测试的成本显著更高。
NVIDIA 研究提出了生成式预训练控制器(GPC),一种使用离散token和基于Transformer的下一token预测来预训练电机控制的方法,从而可以针对新任务进行微调。GPC在600多小时的运动数据上训练,可在实时物理仿真中运行,实现交互式控制。
PhysiFormer 使用坐标空间扩散生成物理上合理的3D物体运动,无需显式归纳偏置,实现了高效的多物体推理以及对复杂材料和几何形状的泛化。
介绍了 Neural Particle Automata,一种使用光滑粒子流体动力学感知来学习自组织粒子动力学的方法,使粒子能够拥有局部感知向量以执行更新规则,类似于神经细胞自动机,但在连续粒子位置上。
本文介绍了 Environments AI,这是一个能够为物理模拟生成并运行代码的工具,有助于更轻松地创建模拟环境。
Z.ai 发布了 GLM-5.2,这是一款具有开放权重的 AI 模型,在编码和智能体性能方面有所提升,通过在三个任务的物理模拟基准测试中击败 Kimi K2.7 Code 得到证明。
AdaVoMP 使用稀疏自适应体素结构和 Transformer 编码器-解码器来预测三维物体的空间变化力学属性,从而实现高分辨率可变形模拟,提高了准确性和效率。
新竞技场让LLM控制物理布娃娃进行武器对决,用户定义武器伤害区域、盲评投票,模型争夺Elo排名。免费模型如Llama 3.3和GPT-OSS参与竞争,基础设施可自托管。
提出了将分裂共形预测首次应用于基于神经算子的物理模拟,提供了具有有限样本覆盖保证的无分布预测区间,并利用MC Dropout不确定性生成自适应宽度的区间。
PhyGenHOI是一个新颖框架,通过将运动扩散模型与物质点方法模拟相结合,利用3D高斯表示生成物理精确的4D人-物交互。
一篇博客教程,解释如何在Godot游戏引擎中实现Navier-Stokes流体模拟,包含代码和数学解释,供学习使用。
一项实验向 GPT-4o、Claude 3.5 Sonnet 等其他模型提供相同的双摆提示,结果显示它们选择了相反的角约定,导致在共享渲染器中立即出现可见的不匹配。这种约定分裂在不同模型家族间并非随机,表明在经典力学问题的训练数据分布中存在偏差。
本文提出了一种基于代理的框架,利用编码代理从自然语言提示生成物理上可信的世界模拟,在物理准确性和指令保真度方面优于基于视频的模型。
RigidFormer 是一种新型的无网格、以对象为中心的 Transformer 模型,能够从点云中学习刚体动力学。在多对象接触动力学方面,其在速度和可扩展性上优于基于网格的基线模型。
Yann LeCun的团队发布了LeWorldModel,一个仅有1500万参数的物理模型,在单张GPU上训练数小时,在规划速度和物理合理性上超越了价值数十亿美元的基础模型,挑战了主流的规模扩展范式。
PhysForge 是一个两阶段框架,能够生成具备物理基础和运动学参数的交互式 3D 资产,解决了虚拟世界中静态几何模型带来的瓶颈问题。
Google DeepMind 维护的 MuJoCo 是一款高性能开源物理引擎,提供 C/Python API 与 Unity 插件,专为机器人与机器学习研究设计。
The Well是一个包含16个领域、15TB多样化物理模拟数据集的大规模集合,旨在为时空物理系统的机器学习代理模型提供基准测试。它提供了统一的PyTorch接口和示例基线,以加速基于模拟的工作流程。