标签
一款名为Nova3D的新型开源工具利用大语言模型(LLM)生成具有独立逻辑部件的3D对象(例如,带有内部组件和可开关门的微波炉),不同于传统的整体式AI生成器。它通过编写Blender Python代码,创建干净、模块化的GLB导出文件,适用于动画和编辑。
BrickAnything是一种自回归框架,通过点云和结构感知树标记化,从多种3D表示中生成物理可构建的砖块结构,确保几何保真度和结构稳定性。
OpenArt 现在允许用户将单张图像转化为持久的3D世界,并实现精确的相机控制,该功能由 World Labs API 提供支持。
PhysX-Omni 是一个统一的框架,用于可模拟的物理3D生成,涵盖刚体、可变形体和关节物体,并带有新数据集(PhysXVerse)和基准(PhysX-Bench)。
MVCHead 是一种新颖的方法,仅从单张二维图像生成三维高斯头部头像,无需多视角数据,利用分层状态空间模型和跨视角一致性约束。
PhysX-Omni是一个统一框架,用于生成涵盖刚体、可变形体和铰接物体等类别的可仿真3D资产,它引入了一种适用于视觉语言模型的新型几何表示、一个新数据集(PhysXVerse)以及一个全面的评估基准(PhysX-Bench)。
一位开发者构建了一个流程,将LLM用作结构化代码编译器来生成Blender Python代码,从而生成带有功能性铰接部件的3D对象,而非单一网格。该工具开源且与LLM无关。
DeemosTech 推出 Rodin Gen-2.5,号称是全球首个 1000 万多边形 3D 生成式 AI 模型,能够在 4 秒内生成 100 万多边形,具备自适应思维和原生 3D 纹理。
一种名为Code-as-Room的新型基于MLLM的代理框架,通过将俯视图图像转换为可执行的Blender代码,利用带有跨阶段记忆的结构化执行引擎来维持上下文,从而生成3D室内房间。
剑桥大学助理教授Elliott Wu团队发布Articraft——一个agentic coding系统,可自动生成带零件、关节和真实运动的可交互3D资产,并开源Articraft-10K数据集,大幅降低机器人训练和物理AI的资产门槛。
EVA01是一个统一框架,通过混合变换器架构将3D网格作为原生模态集成到多模态语言模型中,实现了先进的文本到3D生成以及长上下文多轮几何编辑。
一种新型AI工具通过生成代码来创建3D物体,从而得到具有独立功能部件的物体,而非单一实心块。该工具免费开源,托管于GitHub。
使用image-blaster(由World Labs团队成员构建的工具),在几分钟内将单张图片转换为完整网格化的3D世界。该工具结合了Marble、Claude skills和Fal,用于生成3DGS环境、网格、物理对象和SFX。
Sat3DGen采用几何优先的方法,从单张卫星图像生成街景级3D场景,通过新颖的约束条件和训练策略,提高了几何精度和照片级真实感。该方法在VIGOR-OOD基准测试上相比先前工作有显著改进。
This article introduces 3DCellForge, an open-source React and Three.js-based web application for generating and exploring interactive 3D models. It utilizes AI models like Hunyuan 3D and Tripo via ComfyUI or direct API integration to create visualizations of objects such as aircraft and spacecraft.
Pixal3D提出了一种像素对齐的3D生成方法,通过反向投影条件化建立直接的像素到3D对应关系,从而提高保真度,解决了规范空间生成中的问题。
作者描述了一个使用 Gemini Nano Pro、Tripo 和 Codex 生成 3D 生物结构的工作流,强调了 AI 在加速教育方面的潜力。
The developer announces the open-sourcing of an Image-to-3D model tool that currently integrates with the Tripo3D API, encouraging users to adapt it for other services or local models.