标签
用户在最新的llama.cpp和Qwen-3.6-27b模型下使用tensor split模式时,在配备双RTX 3090、Ubuntu Server 24.04和Docker的环境中报告了CUDA错误。
Reddit 用户称 Qwen 3.6-27B 表现出罕见的主动行为,无需提示就自主编写、测试并修复代码。