speed-improvement

标签

Cards List
#speed-improvement

Deepseek 又带来重大突破——DSpark。比 MTP 快太多了 [视频详解]

Reddit r/LocalLLaMA · 22小时前

Deepseek 宣布了 DSpark,这是一项新的 AI 突破,速度显著快于 MTP,视频中有详细解释。

0 人收藏 0 人点赞
#speed-improvement

提示:使用这个llama.cpp的PR提升Intel ARC上的提示处理速度

Reddit r/LocalLLaMA · 昨天

一个llama.cpp的PR显著提升了Intel ARC GPU上的提示处理速度,基准测试显示在B580上从245t/s提升到462t/s。目前该改进仅适用于F16 KV量化,计划后续支持其他量化方式。

0 人收藏 0 人点赞
#speed-improvement

@DataChaz:@NVIDIA 刚刚发布了 LocateAnything,通过修复一个核心瓶颈使物体检测速度提升约10倍:模型如何…

X AI KOLs Following · 2026-06-17 缓存

NVIDIA发布了LocateAnything,这是一个开源模型,通过同时预测所有坐标而非顺序预测,实现了约10倍的物体检测速度提升,在单块H100上达到12.7 FPS,并超越了320亿参数模型。

0 人收藏 0 人点赞
#speed-improvement

@victormustar: 支持MTP的llama.cpp使本地模型足够快,可作为日常驱动 Qwen3.6-27B密集生成(在A10G上…

X AI KOLs Following · 2026-05-18 缓存

llama.cpp为Qwen3.6模型添加MTP支持,在A10G硬件上将生成速度提升78%,使本地模型可作为日常驱动使用。

0 人收藏 1 人点赞
#speed-improvement

@gabriel1:如果 Claude 5.5 速度提升 20 倍,你就能边说边写代码,界面会随着你说话实时更新

X AI KOLs Following · 2026-05-08

有人推测,如果 Claude 5.5 速度提升 20 倍,用户将能够实时对话并编写代码,界面会随着语音输入同步更新。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈