ai-model-optimization

标签

Cards List
#ai-model-optimization

@LottoLabs: 这是Dflash为Qwen 3.5/6系列所做的出色工作

X AI KOLs Timeline · 4天前 缓存

Charles Frye宣布与Z Lab共同发布六款新的DFlash推测器,用于阿里巴巴Qwen 3.x系列模型,在B200上为Qwen 3.5 122B-A10B实现了每秒超过1000个输出token。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈