fal/LTX-2.3-3DREAL-LoRA
摘要
针对LTX-2.3的LoRA适配器,能将粗糙的3D视口动画(来自Blender、游戏引擎)转换为逼真的视频,同时保留构图和相机运动。
查看缓存全文
缓存时间: 2026/06/28 17:22
fal/LTX-2.3-3DREAL-LoRA · Hugging Face 来源:https://huggingface.co/fal/LTX-2.3-3DREAL-LoRA
这是一个用于 LTX-2.3 的 IC‑LoRA(上下文 LoRA),可将粗糙的灰色 3D 视口动画(简单的低多边形粗模)转化为完全 照片级真实感、电影级画质 的视频,同时保持输入的 精确构图、运镜和布局。它专为 3D 场景和合成数据 设计——Blender 粗模、游戏引擎视口及其他 CG/合成渲染都能变成照片级真实的视频。
示例
上方 = 生成结果 · 下方 = 3D 渲染输入
harbor(https://huggingface.co/fal/LTX-2.3-3DREAL-LoRA/blob/main/assets/example_harbor.gif) cargo(https://huggingface.co/fal/LTX-2.3-3DREAL-LoRA/blob/main/assets/example_cargo.gif)
使用方法
最简单的方式是在 fal 上使用即用型端点(适配器已加载,无需复制):
https://fal.ai/models/fal-ai/ltx-2.3-quality/render-to-real
import fal_client
result = fal_client.subscribe(
"fal-ai/ltx-2.3-quality/render-to-real",
arguments={
"video_url": "<your-3d-render-video-url>",
"image_url": "<optional-photoreal-reference-frame>",
# 提示词始终以 3DREAL 触发词开头;描述照片级真实的结果
"prompt": "3DREAL. Make it photorealistic. A cargo ship stacked with shipping containers in a busy harbor.",
"resolution": "720p",
},
)
print(result["video"]["url"])
- 触发词:
3DREAL—— 始终放在提示词的开头 - 输入: 一段 3D/CG/游戏渲染视频(
video_url)+ 可选的用于首帧的照片级真实参考图(image_url) - 基础模型: LTX‑2.3
变体——轻版与强版
本仓库提供 两个 适配器——根据你需要的美术风格进行选择:
- 3DREAL Light(
3DREAL-light.safetensors)——忠实、温和的变换。贴近输入的结构、构图和运动;幻觉更少。这是托管端点render-to-real默认使用的版本。 - 3DREAL Strong(
3DREAL-strong.safetensors)——更强、更激进的照片级真实化推动。真实感和细节更多,在复杂场景中通常表现更好,但可能会稍微偏离输入。
要使用显式权重运行特定变体,请使用 LoRA 端点:
import fal_client
result = fal_client.subscribe(
"fal-ai/ltx-2.3-quality/reference-video-to-video/lora",
arguments={
"video_url": "<your-3d-render-video-url>",
"image_url": "<optional-photoreal-reference-frame>",
"prompt": "3DREAL. Make it photorealistic. <describe your scene>.",
"loras": [{"path": "<path-to-safetensors>", "scale": 1.0}],
"resolution": {"width": 1280, "height": 704},
},
)
print(result["video"]["url"])
权重:
- Light — https://v3b.fal.media/files/b/0a9fd993/oow7bW3VueUPTukqAQkd7_3DREAL.safetensors
- Strong — https://v3b.fal.media/files/b/0a9fe083/H7caCyG_wt9hy_51tMEmu_3DREAL-strong.safetensors
示例提示词
3DREAL. 使其呈现照片级真实感。一艘集装箱货轮停靠在黎明时分繁忙的港口。
3DREAL. 使其呈现照片级真实感。一列蒸汽火车蜿蜒穿过雾气弥漫的山谷。
3DREAL. 使其呈现照片级真实感。一辆孤零零的汽车在日落时分驶过无尽沙漠公路。
3DREAL. 使其呈现照片级真实感。一间水晶吊灯的豪华宴会厅,镜头缓慢平移。
3DREAL. 使其呈现照片级真实感。金色时刻海岸悬崖上的灯塔和拍岸海浪。
3DREAL. 使其呈现照片级真实感。一列流线型高速列车疾驰穿过翠绿的乡村。
相似文章
LiconStudio/Ltx2.3-VBVR-lora-I2V
LiconStudio 发布了一个针对 LTX-2.3 的 LoRA 适配器,该适配器在 VBVR 数据集上进行了微调,以增强视频生成能力,改善提示理解、运动动态和时间一致性,用于复杂的视频推理任务。
Lightricks/LTX-2.3
Lightricks 发布了 LTX-2.3,这是一个基于扩散的开放权重音视频基础模型,具有改进的质量和提示遵循性,提供多个检查点,包括蒸馏和 LoRA 变体,可在本地执行。
Lightricks/LTX-2.3-22b-IC-LoRA-LipDub
这个Hugging Face模型页面介绍了一个基于LTX-2.3-22b训练的IC-LoRA,用于唇语同步配音,包含项目页面、论文和推理流程。
Video2LoRA: 视觉-语言模型的参数化视频内化
本文介绍Video2LoRA,一种直接从视频表示预测低秩适配(LoRA)权重的方法,能够在冻结的视觉-语言模型中实现高效的视频处理。它将视觉令牌负载降低最多1500倍,查询TTFT降低6-80倍,同时在视频摘要和字幕生成基准上保持性能。
Lightricks/LTX-2
LTX-2 是 Lightricks 推出的首个基于 DiT 的音频-视频基础模型,提供同步音频和视频生成、高保真度以及可投入生产的输出,并附带开源代码和开放模型权重。