LiconStudio/Ltx2.3-VBVR-lora-I2V

Hugging Face Models Trending 04/08/26, 01:43 AM Models

Summary

LiconStudio releases a LoRA adapter for LTX-2.3 fine-tuned on the VBVR dataset to enhance video generation with improved prompt understanding, motion dynamics, and temporal consistency for complex video reasoning tasks.

Tags: diffusers, video-generation, video-reasoning, logical-reasoning, lora, ltx-2.3, en, zh, base_model:Lightricks/LTX-2.3, base_model:adapter:Lightricks/LTX-2.3, license:other, region:us

Original Article

View Cached Full Text

Cached at: 04/20/26, 02:45 PM

LiconStudio/Ltx2.3-VBVR-lora-I2V · Hugging Face

Source: https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#ltx-2-vbvr-lora—video-reasoningLTX-2 VBVR LoRA - Video Reasoning

LoRA fine-tuned weights for LTX-2.3 22B on the VBVR (A Very Big Video Reasoning Suite) dataset.

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#training-dataTraining Data

To ensure training quality, we preprocessed the full 1,000,000 videos from the official dataset and randomly sample during training to maintain data diversity. We adopt the official parameters with batch_size=16 and rank=32 to prevent catastrophic forgetting caused by excessively large rank.

The VBVR dataset contains 200 reasoning task categories, with ~5,000 variants per task, totaling ~1M videos. Main task types include:

Object Trajectory: Objects moving to target positions
Physical Reasoning: Rolling balls, collisions, gravity
Causal Relationships: Conditional triggers, chain reactions
Spatial Relationships: Relative positions, path planning

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#model-detailsModel Details

ItemDetailsBase Modelltx-2.3-22b-devTraining MethodLoRA Fine-tuningLoRA Rank32Effective Batch Size16Mixed PrecisionBF16

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#todo-listTODO List

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#dataset-release-planDataset Release Plan

DatasetVideosStatusVBVR-96K96,000✅ ReleasedVBVR-240K240,000🔄 ProcessingVBVR-480K480,000📋 Planned

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#lora-capabilitiesLoRA Capabilities

This LoRA adapter enhances the base LTX-2 model for production video generation workflows:

Enhanced Complex Prompt Understanding: Accurately interprets multi-object, multi-condition prompts with detailed spatial descriptions and temporal sequences, reducing prompt misinterpretation in production scenarios.
Improved Motion Dynamics: Generates smooth, physically plausible object movements with natural acceleration, deceleration, and trajectory curves, avoiding robotic or unnatural motion patterns.
Temporal Consistency: Maintains object appearance, lighting, and scene coherence throughout the video sequence, reducing flickering and frame-to-frame artifacts common in generated videos.
Precise Timing Control: Enables accurate control over action duration, pacing, and synchronization between multiple moving elements based on prompt semantics.
Multi-Object Interaction: Handles complex scenes with multiple objects interacting simultaneously, including collisions, following, avoiding, and coordinated movements.
Camera and Framing Stability: Maintains consistent camera perspective and framing throughout the sequence, avoiding unwanted camera shake or unexpected viewpoint changes.

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#training-configurationTraining Configuration

ConfigValueLearning Rate1e-4SchedulerCosineGradient Accumulation16 stepsGradient Clipping1.0OptimizerAdamW

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#evaluation-metricsEvaluation Metrics

MetricValueTraining Steps~6,000Final Loss~0.008Loss Reduction44% (from 0.014 to 0.008)

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#video-demoVideo Demo

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#training-progress-comparisonTraining Progress Comparison

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#step-0-base-modelStep 0 (Base Model)

Initial model output.

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#step-6000-fine-tunedStep 6000 (Fine-tuned)

After 6K steps of training.

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#datasetDataset

This model is trained on the VBVR (Video Benchmark for Video Reasoning) dataset fromvideo-reason.com.

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#contactContact

For questions or suggestions, please open an issue on Hugging Face or contact the author directly.

LiconStudio/Ltx2.3-VBVR-lora-I2V

LiconStudio/Ltx2.3-VBVR-lora-I2V · Hugging Face

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#ltx-2-vbvr-lora—video-reasoningLTX-2 VBVR LoRA - Video Reasoning

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#training-dataTraining Data

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#model-detailsModel Details

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#todo-listTODO List

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#dataset-release-planDataset Release Plan

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#lora-capabilitiesLoRA Capabilities

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#training-configurationTraining Configuration

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#evaluation-metricsEvaluation Metrics

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#video-demoVideo Demo

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#training-progress-comparisonTraining Progress Comparison

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#step-0-base-modelStep 0 (Base Model)

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#step-6000-fine-tunedStep 6000 (Fine-tuned)

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#datasetDataset

https://huggingface.co/LiconStudio/Ltx2.3-VBVR-lora-I2V#contactContact

Similar Articles

fal/LTX-2.3-3DREAL-LoRA

Lightricks/LTX-2.3-22b-IC-LoRA-LipDub

Lightricks/LTX-2.3

Video2LoRA: Parametric Video Internalization for Vision-Language Models

LLaVA-OneVision-2: Towards Next-Generation Perceptual Intelligence

Submit Feedback

Similar Articles

Lightricks/LTX-2.3-22b-IC-LoRA-LipDub

Video2LoRA: Parametric Video Internalization for Vision-Language Models

LLaVA-OneVision-2: Towards Next-Generation Perceptual Intelligence