3d-generation

#3d-generation

@NicolasZu：又一个惊呆了的时刻。使用Codex作为完全定制的游戏引擎，配合新发现的、疯狂的 img2threejs技能……

X AI KOLs Timeline ↗ · 2天前缓存

Nicolas Zullo演示了一种工作流程，利用Codex和img2threejs根据文本提示生成3D游戏资产，并自动将其集成到游戏引擎中。

0 人收藏 0 人点赞

#3d-generation

DiffGI: 用于高保真薄壳3D生成的可微分几何图像

Hugging Face Daily Papers ↗ · 2026-07-15 缓存

DiffGI引入了一种可微分几何图像表示，用于高保真薄壳3D生成，实现了端到端优化和卓越的重建质量。

0 人收藏 0 人点赞

#3d-generation

Hallo4D: 多模态幻觉缓解实现一致时空生成

Hugging Face Daily Papers ↗ · 2026-07-15 缓存

Hallo4D是一个模型无关框架，利用大型多模态语言模型检测和纠正3D与4D生成中的空间和时间幻觉，在无需重新训练的情况下改善跨视角和时间的一致性。

0 人收藏 0 人点赞

#3d-generation

本地图像转3D（<2GB内存，<20秒，Apple Silicon，iPhone）

Reddit r/LocalLLaMA ↗ · 2026-07-12

一种新模型可在Apple Silicon设备和iPhone上本地从单张图像生成3D模型，内存占用低于2GB，耗时不到20秒。

0 人收藏 0 人点赞

#3d-generation

SynCity 3000: 自举场景级3D扩散

Hugging Face Daily Papers ↗ · 2026-07-06 缓存

SynCity 3000 提出了一种框架，用于生成大规模、全局一致的3D场景，该框架通过将图像到3D生成器适配为卷积算子，并在来自新数据引擎的合成场景数据上进行微调来实现。

0 人收藏 0 人点赞

#3d-generation

PixWorld：在像素空间中统一3D场景生成与重建

Hugging Face Daily Papers ↗ · 2026-07-06 缓存

PixWorld提出了一种统一的像素空间扩散方法，用于3D场景重建与生成，通过直接的图像级监督和几何感知特征对齐，克服了潜在空间方法的局限性。该方法优于先前的生成方法，并达到了与最先进的重建方法相当的性能。

0 人收藏 0 人点赞

#3d-generation

CONFLUX：一种用于3D胸部CT合成的潜在扩散模型，采用强化学习后训练

Hugging Face Daily Papers ↗ · 2026-07-03 缓存

CONFLUX是一种用于胸部CT合成的3D潜在扩散模型，能够实现高保真的体积生成，并具有可控的临床属性。通过强化学习后训练阶段增强了条件生成的可靠性。该模型及一个包含约20万胸部CT体积的合成数据集已发布。

0 人收藏 0 人点赞

#3d-generation

在iPhone上运行Hunyuan3D图像转3D对象

Reddit r/LocalLLaMA ↗ · 2026-06-30

本文介绍如何直接在iPhone上运行Hunyuan3D——一种将图像转换为3D对象的AI模型。

0 人收藏 0 人点赞

#3d-generation

FLAT: 面向几何精确场景生成的前馈潜在三角形溅射

Hugging Face Daily Papers ↗ · 2026-06-23 缓存

FLAT提出了一种方法，直接从视频扩散潜在表示中解码显式三角形溅射，用于几何精确的3D场景生成。它引入了以射线为中心的旋转参数化和乘积窗口函数来改善梯度流，实现了比先前前馈方法更好的几何精度，同时支持实时渲染。

0 人收藏 0 人点赞

#3d-generation

FLUX3D: 基于扩散对齐稀疏表示的高保真3D高斯生成

Hugging Face Daily Papers ↗ · 2026-06-23 缓存

FLUX3D引入了一个框架，通过利用扩散对齐的结构化潜变量和稀疏结构感知的扩散变压器来增强表示学习和跨模态对齐，实现高保真图像到3D高斯泼溅生成，取得了最先进的结果。

0 人收藏 0 人点赞

#3d-generation

Arbor：面向可控3D资产生成的显式几何条件化方法

Hugging Face Daily Papers ↗ · 2026-06-22 缓存

Arbor通过使用约束网格（壳体、避让、接触区域）对潜在生成进行条件化，为3D资产生成引入了显式几何控制，在不牺牲物体质量的前提下提升了空间约束的遵从性。

0 人收藏 0 人点赞

#3d-generation

JanusMesh: 快速零样本3D视觉幻觉生成——基于跨空间去噪

Hugging Face Daily Papers ↗ · 2026-06-18 缓存

JanusMesh 是一个快速、免训练的框架，通过将生成过程解耦为跨空间双分支去噪和视图条件纹理合成，生成文本驱动的3D视觉错觉——单个网格从不同视角展示不同语义——在仅3-5分钟内实现高真实感。

0 人收藏 0 人点赞

#3d-generation

分子潜在扩散中的暗区平滑化

arXiv cs.LG ↗ · 2026-06-15 缓存

本文介绍了TopVAE，一种拓扑优化的变分自编码器，通过让解码器内化结构和化学约束来减少分子潜在扩散中的“暗区”，从而显著提高分子生成质量。

0 人收藏 0 人点赞

#3d-generation

@mattshumer_: Fable 一次性生成了整个霍格沃茨城堡，包括教室、大礼堂、魁地奇球场等一切

X AI KOLs Following ↗ · 2026-06-12 缓存

Fable AI 展示了其一次性生成整个霍格沃茨城堡的能力，包括教室、大礼堂和魁地奇球场。

0 人收藏 0 人点赞

#3d-generation

@theworldlabs: 今天我们将分享三篇新研究论文，每篇都探索了利用大规模生成模型和2D先验生成3D内容的新方法…

X AI KOLs Following ↗ · 2026-06-12 缓存

World Labs 宣布了三篇新研究论文，专注于利用大规模生成模型和2D先验生成3D内容，由实习生 Hao Zhang、Bert Duisterhof 和 Ben Tunnels 主导。

0 人收藏 0 人点赞

#3d-generation

@Midge_xbt：不错的演示，但单次胎儿第一人称渲染改变了威胁模型，想想可能的深度伪造、数据集来源…

X AI KOLs Following ↗ · 2026-06-10 缓存

这条推文讨论了Claude Fable 5一次性生成可探索的子宫内婴儿3D世界的影响，引发了对深度伪造、数据集来源以及合成医疗内容的担忧。

0 人收藏 0 人点赞

#3d-generation

@mervenoyann: DiffusionGemma 已发布，它受计算限制，因此相比其他 Gemma-4 模型快 4 倍（H100 上 1k tok/s），在……方面也很出色

X AI KOLs Following ↗ · 2026-06-10 缓存

DiffusionGemma 已发布；它受计算限制，比其它 Gemma-4 模型快 4 倍（H100 上 1k tok/s），擅长编码任务，包括 3D 生成和前端开发。

0 人收藏 0 人点赞

#3d-generation

P3D-Bench：参数化3D生成与结构推理的多模态大语言模型基准测试

Hugging Face Daily Papers ↗ · 2026-06-09 缓存

本文提出P3D-Bench，一个用于评估多模态大语言模型在参数化3D生成任务上的基准测试，涵盖文本到3D、图像到3D和组装到3D，并采用几何精度、语义对齐和部件级结构等指标。

0 人收藏 0 人点赞

#3d-generation

我构建了一个工具，可以生成由独立逻辑部件组装的3D对象（例如，视频中生成的微波炉具有完整的内部组件和一扇可开关的门）

Reddit r/artificial ↗ · 2026-05-30

一款名为Nova3D的新型开源工具利用大语言模型（LLM）生成具有独立逻辑部件的3D对象（例如，带有内部组件和可开关门的微波炉），不同于传统的整体式AI生成器。它通过编写Blender Python代码，创建干净、模块化的GLB导出文件，适用于动画和编辑。

0 人收藏 0 人点赞

#3d-generation

BrickAnything：基于几何条件的可构建砖块生成与结构感知标记化

arXiv cs.AI ↗ · 2026-05-27 缓存

BrickAnything是一种自回归框架，通过点云和结构感知树标记化，从多种3D表示中生成物理可构建的砖块结构，确保几何保真度和结构稳定性。

0 人收藏 0 人点赞

3d-generation

提交意见反馈