Image-blaster: 从单张图像创建3D环境、音效和网格
摘要
一款CLI工具,利用Claude技能、World Labs和FAL模型,在五分钟内将单张图像转换为包含物体、环境音效和物理特效的完整3D网格环境。
查看缓存全文
缓存时间: 2026/05/15 18:33
neilsonnn/image-blaster
来源:https://github.com/neilsonnn/image-blaster
image-blaster
利用 Claude 技能、World Labs 和 FAL,从单张图像创建 3D 环境、音效和网格。可在 5 分钟内将一张图像变为完整的网格化 3D 环境,非常适合快速启动 3D 工作。火力全开。
快速开始
- 打开终端,输入
git clone https://github.com/neilsonnn/image-blaster - 进入目录:
cd image-blaster - 运行
claude(安装命令:curl -fsSL https://claude.ai/install.sh | bash) - 向 Claude 打招呼,并为其提供 World Labs (https://platform.worldlabs.ai/) 和 FAL (https://fal.ai/) 的 API 密钥。
- 将图像放入
input/目录,然后让 Claudeblast it and confirm each step with me。
说明
默认情况下,image-blaster 会使用你的输入图像来创建:
- 所有动态物体的 3D 模型(
.glb、.obj) - 静态环境的高斯泼溅(
.spz) - 环境循环音效及物体特定的物理音效(
.mp3)
扩展
你可以将 image-blaster 嵌入到任何游戏引擎、DCC 软件或 Web 应用的资源中:
- Unity、Unreal 或 Godot 游戏引擎
- Blender、3DS Max、Maya 或其他 DCC 软件
- Three.js Web 应用或 Electron 应用
高级
IMAGE-BLASTER 使用了以下几个生成模型:
marble-1.1– World Labs Marble 模型创建可探索的环境。nano-banana– 默认的图像编辑偏好,用于源清理、干净背景和物体参考图像。gpt-image-2– 当编辑技能被要求偏好该模型时的替代图像编辑提供者。hunyuan-3d– Hunyuan 3D 模型通过 FAL 创建 3D 物体模型。elevenlabs-sfx– ElevenLabs 音效模型创建环境音效和物体特定声音。
3D 模型创建支持以下 Hunyuan 参数:
--face-count <40000-1500000>:目标面数。IMAGE-BLASTER 默认为50000;Hunyuan 的 API 默认为500000。--enable-pbr true|false:启用 PBR 材质生成。默认值为true。--generate-type Normal|LowPoly|Geometry:Normal创建带纹理的模型,LowPoly应用多边形简化,Geometry创建仅含几何的白色模型。默认值为Normal。--polygon-type triangle|quadrilateral:LowPoly模式下的多边形类型。默认值为triangle。
示例
- 需要游戏关卡概念?
IMAGE-BLAST它。 - 你的童年卧室?
IMAGE-BLAST它。 - 需要一个机器人环境?
IMAGE-BLAST它。 - 电影外景勘景?
IMAGE-BLAST它。 - 建筑渲染图?
IMAGE-BLAST它。
开发
- 从
.claudeignore文件中移除/app,让 Claude 能够修改 React 查看器。
相似文章
@theworldlabs: 在几分钟内将单张图片转换为完整网格化的3D世界 由World Labs团队成员构建,image-blaster结合了M…
使用image-blaster(由World Labs团队成员构建的工具),在几分钟内将单张图片转换为完整网格化的3D世界。该工具结合了Marble、Claude skills和Fal,用于生成3DGS环境、网格、物理对象和SFX。
PixelClaw:用于图像处理的 LLM 智能体
PixelClaw 是一款免费开源的 LLM 智能体,在基于 Raylib 的拖放界面中融合对话式 AI、图像生成与编辑以及音频工具。
@oliviscusAI: 有人刚刚开源了一款桌面应用,它可以通过图像生成3D模型,并且完全本地运行。它叫Modly。…
Modly是一款开源桌面应用,可从图像生成完全纹理化的3D网格,完全在本地GPU上运行,并支持可插拔的AI模型扩展。
Point-E:从复杂文本提示生成3D点云的系统
OpenAI推出Point-E,一个通过结合文本到图像和图像到3D的扩散模型,能在单个GPU上在1-2分钟内从文本提示生成3D点云的系统。该方法相比现有方法实现了显著的速度提升,同时发布了预训练模型和代码。
HY-World 2.0:用于重建、生成和模拟三维世界的多模态世界模型
HY-World 2.0 是一个多模态世界模型框架,通过全景生成、轨迹规划和场景组合等专用模块,从文本、图像和视频中生成高保真度的三维高斯泼溅场景,在开源方法中实现了最先进的性能。