标签
用户在最新的llama.cpp和Qwen-3.6-27b模型下使用tensor split模式时,在配备双RTX 3090、Ubuntu Server 24.04和Docker的环境中报告了CUDA错误。