ornith-35b

#ornith-35b

Ornith 35B 与 Qwen3.6 35B DFlash 推测模型配合效果良好

Reddit r/LocalLLaMA ↗ · 9小时前

在 llama-server 中，Ornith 35B 与 Qwen3.6 35B DFlash 推测模型搭配使用时，token 生成速度提升了 30-40%，在混合代码和文本上实现了 80% 的接受率，但提示处理性能有所下降。

0 人收藏 0 人点赞