@no_stp_on_snek: 进行中

X AI KOLs Following 工具

摘要

推广 Atlas Inference,这是一个开源推理服务工具,在 Qwen3.6-35B-A3B 基准测试上实现了 200+ tok/s 的性能。

进行中 https://t.co/DFkWLU43lH
查看原文
查看缓存全文

缓存时间: 2026/05/24 08:18

进行中 https://t.co/DFkWLU43lH

Azeez (@AtlasInference): 试试 Atlas Inference。不到2分钟即可完成部署上线。
https://t.co/vxZLwBJMub ⚡️

开箱即用,与 sparkrun 配合良好。Docker 命令也都在网站上,欢迎索取。

开源项目,最新版本在 Qwen3.6-35B-A3B 基准测试中达到了 200+ tok/s 的成绩!

相似文章

@no_stp_on_snek: https://x.com/no_stp_on_snek/status/2052833502475833384

X AI KOLs Following

使用 Qwen2.5-32B-Instruct 搭配 longctx 和 vllm-turboquant 的单个 AMD MI300X 开源技术栈,在 MRCR v2 百万级上下文基准测试中取得了与 SubQ 闭源模型(0.659)相竞争的结果(0.601-0.688),表明开源权重方法已接近达到同等水平。