tensor-split

Tag

#tensor-split

Best Settings for 48GB VRAM + Qwen 3.6 27B

Reddit r/LocalLLaMA ↗ · yesterday

A user shares optimized settings for running Qwen3.6 27B (Q8_0) on a dual GPU setup (RTX 4090 + RTX 3090) with llama.cpp, achieving 75-100 t/s and 1500 pp with 250k context.

0 favorites 0 likes

← Back to home

tensor-split

Best Settings for 48GB VRAM + Qwen 3.6 27B

Submit Feedback