@tenstorrent: 感谢东京!以下是我们在TT-Deploy Japan上宣布的所有内容:更快的AI推理 • Kimi K2.6 900 t/s/u,速度提升3倍…

X AI KOLs Timeline 产品

摘要

Tenstorrent在TT-Deploy Japan上宣布,其硬件上对Kimi K2.6、LTX 2.3和DeepSeek-R1实现了更快的AI推理,此外还推出了可授权的TT-Ascalon S RISC-V CPU,用于生成式AI代理应用。

感谢东京!以下是我们在TT-Deploy Japan上宣布的所有内容: 更快的AI推理 • Kimi K2.6 900 t/s/u,比GPU快3倍 • LTX 2.3 快速视频生成:约6秒生成6秒视频,144帧,1080p,比GPU快4倍 • DeepSeek-R1-0528 671B 400+ t/s/u TT-Ascalon S 现已可用 • 一款可授权的RISC-V CPU,专为下一代AI代理应用而设计 异构或独立部署 • 轻松将Tenstorrent Galaxy与现有基础设施搭配部署或独立部署 • @aiand_ 的自主异构推理平台,采用Tenstorrent Galaxy™超级集群
查看原文
查看缓存全文

缓存时间: 2026/07/03 06:31

谢谢东京!以下是我们在 TT-Deploy Japan 上宣布的所有内容:

更快的AI推理
• Kimi K2.6 900 t/s/u,比GPU快3倍
• LTX 2.3 Fast 约6秒生成6秒视频,144帧,1080p,比GPU快4倍
• DeepSeek-R1-0528 671B 400+ t/s/u

TT-Ascalon S 今日可用
• 一款可授权的RISC-V CPU,专为下一代智能体AI应用打造

异构或独立部署
• 轻松将 Tenstorrent Galaxy 与现有基础设施一起部署,或独立部署
• @aiand_ 的自主异构推理平台,基于 Tenstorrent Galaxy™ 超级集群

相似文章

@songhan_mit: 我们开发了一种基于智能体的原生方法来加速生成式AI,延续了KDA(内核设计智能体)在更高层次上的成功…

X AI KOLs Following

Enze Xie 宣布推出 Sol Video Inference Engine,这是一个基于智能体的原生、无需训练的全栈加速器,用于视频扩散,能够自动调整缓存、稀疏注意力、令牌剪枝、量化和内核融合,在像 64B Cosmos3-Super 和 22B LTX-2.3 这样的大模型上实现了 >2 倍的端到端加速。