qwen-3.5

标签

Cards List
#qwen-3.5

prefeitura-rio/Rio-3.5-Open-397B

Hugging Face Models Trending · 2026-06-11 缓存

Rio 3.5 Open 397B 是一个开源的前沿AI模型,基于 Qwen 3.5 397B 进行后训练,采用 SwiReasoning 实现动态显式/隐式推理切换,在智能体编程、推理和多语言基准测试中取得了最先进的性能。

0 人收藏 0 人点赞
#qwen-3.5

40+ token/秒 - 在单台 DGX Spark 上使用 vLLM 运行 Qwen 3.5 122B Int4 的优化方案

Reddit r/LocalLLaMA · 2026-05-20

用户分享了一种在单台 DGX Spark 上使用 vLLM 运行 Qwen 3.5 122B Int4 的优化方案,实现了每秒超过 40 个 token 的速度。他们邀请其他人尝试并进一步优化。

0 人收藏 0 人点赞
#qwen-3.5

个人评测后续:Gemma4 26B MoE(Q8)vs Qwen3.5 27B Dense vs Gemma4 31B Dense 对比

Reddit r/LocalLLaMA · 2026-04-22

个人基准测试显示,Qwen3.5-27B Dense 与 Gemma4-31B Dense 在 37 个失败用例中修复率 100%,即使 8-bit 量化的 Gemma4-26B MoE 也望尘莫及,同时消耗更少 token 与更短挂钟时间。

0 人收藏 0 人点赞
#qwen-3.5

@bastani_behnam:我们刚刚发布了如何在 27B 模型上解锁 +50% 推理容量——无需新 GPU、无需新节点,成本仅为一小部分……

X AI KOLs Following · 2026-04-21 缓存

OpenInfer 展示“垂直拆解”,通过单节点 AMD EPYC CPU 与 Nvidia L40S GPU 协同执行量化层,并配合自定义 SLA 感知调度器,将 Qwen 3.5 27B 的吞吐量提升约 50%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈