acceleration

标签

Cards List
#acceleration

@Sumanth_077:训练大型LLM曾经慢得令人痛苦,但现在不同了!4个加速微调的开源库…

X AI KOLs Timeline · 昨天 缓存

一条推文,重点介绍了四个开源库(Unsloth、LLaMA Factory、DeepSpeed、Axolotl),这些库通过内存和速度优化加速大型语言模型的微调。

0 人收藏 0 人点赞
#acceleration

ResilPhase:即插即用的相位映射与抗噪宏轨迹外推,用于扩散加速

arXiv cs.AI · 3天前 缓存

ResilPhase是一个免训练的扩散模型加速框架,将加速推理重述为ODE空间中的稳定宏轨迹外推,通过无导数重心拉格朗日外推和有界相位映射,在高加速比下实现最先进的保真度。

0 人收藏 0 人点赞
#acceleration

@songhan_mit: 我们开发了一种基于智能体的原生方法来加速生成式AI,延续了KDA(内核设计智能体)在更高层次上的成功…

X AI KOLs Following · 4天前 缓存

Enze Xie 宣布推出 Sol Video Inference Engine,这是一个基于智能体的原生、无需训练的全栈加速器,用于视频扩散,能够自动调整缓存、稀疏注意力、令牌剪枝、量化和内核融合,在像 64B Cosmos3-Super 和 22B LTX-2.3 这样的大模型上实现了 >2 倍的端到端加速。

0 人收藏 0 人点赞
#acceleration

@eladgil: 感觉AI世界正进入一个新时代。每六个月就迈出一大步。氛围(写于20年前)-

X AI KOLs Timeline · 2026-06-20 缓存

Elad Gil 谈到AI进展的加速步伐,并链接到一篇关于查尔斯·斯特罗斯科幻小说《Accelerando》的评论,该小说探讨了奇点主题。

0 人收藏 0 人点赞
#acceleration

eCNNTO:一种高度可泛化的卷积网络,用于加速拓扑优化

arXiv cs.AI · 2026-06-20 缓存

本文提出了eCNNTO,一种带有残差连接的卷积神经网络,通过从早期迭代历史中预测接近最优的密度来加速基于密度的拓扑优化,实现了最多97%的迭代次数减少,并在不同边界条件、几何形状和网格分辨率下展现出强大的泛化能力。

0 人收藏 0 人点赞
#acceleration

AdaPLD:自适应检索与复用的高效无模型推测解码方法

arXiv cs.CL · 2026-06-05 缓存

AdaPLD是一种无需训练的方法,通过自适应检索结合词汇与语义相似度,并构建分支复用假设来处理续写不确定性,从而提升无模型推测解码的效率,最高可实现3.10倍解码加速。

0 人收藏 0 人点赞
#acceleration

TAPS:面向扩散草稿推测解码的目标感知前缀树选择

arXiv cs.AI · 2026-06-02 缓存

TAPS提出了一种面向扩散草稿推测解码的目标感知前缀树选择方法,通过改善接受-成本权衡,相较于先前方法实现了高达7.9倍的无损端到端加速。

0 人收藏 0 人点赞
#acceleration

GPT-2以来AI模型发展时间线:模型发布速度不断加快

Reddit r/ArtificialInteligence · 2026-06-01

一篇记录自GPT-2以来AI模型发布时间线的文章,强调了模型发布速度不断加快的趋势。

0 人收藏 0 人点赞
#acceleration

真理加速变化:我们向学习我们的机器学习。2030

Reddit r/ArtificialInteligence · 2026-06-01

本文认为,人工智能创造了一个快速反馈循环,人类和机器相互塑造真理,加速共识转变,使得真理越来越合成且脱离现实。

0 人收藏 0 人点赞
#acceleration

推测性流水线解码:通过流水线并行实现更高准确度和零泡沫推测

arXiv cs.CL · 2026-06-01 缓存

本文提出推测性流水线解码(SPD),一种在单个LLM内部利用流水线并行实现并行令牌推测的框架,避免了传统推测解码中多令牌预测的延迟泡沫和准确度下降问题。

0 人收藏 0 人点赞
#acceleration

@gdb: 人工智能加速研究,拓展数学家和科学家敢于尝试的边界:

X AI KOLs Following · 2026-05-30 缓存

Greg Brockman 指出,人工智能让像数学家陶哲轩这样的研究人员得以自由探索更大胆、更具创意的想法。

0 人收藏 0 人点赞
#acceleration

RT-Lynx:以正确方式将GEMM稀疏性应用于扩散模型

Hugging Face Daily Papers · 2026-05-26 缓存

RT-Lynx提出利用激活稀疏性而非权重稀疏性来加速扩散模型,在线性层上实现了高达1.55倍的加速,同时保持生成质量,并被ICML 2026接收。

0 人收藏 0 人点赞
#acceleration

地球现在的升温速度是过去几十年的两倍

Hacker News Top · 2026-05-21 缓存

全球变暖速度已加速至过去几十年的两倍,且98%的置信度表明这种加速是由气候变化导致的。如果变暖持续以这一速度进行,巴黎协定的1.5°C升温限制可能在2028年被突破。

0 人收藏 0 人点赞
#acceleration

@sama: 我们最兴奋的三件事:1. AGI加速研究 2. AGI加速公司 3. 个人A…

X AI KOLs · 2026-05-20 缓存

Sam Altman分享了对AGI的三个兴奋点:加速研究、加速公司以及个人目标。他还提到最近的公告,包括一个单位距离结果以及为Y Combinator创业公司提供200万美元的OpenAI积分。

0 人收藏 0 人点赞
#acceleration

CATS:面向内存受限 LLM 推理加速的级联自适应树猜测

arXiv cs.LG · 2026-05-13 缓存

本文介绍了 CATS,这是一种级联自适应树猜测框架,旨在通过优化内存使用同时保持高 Token 接受率,加速内存受限边缘设备上的 LLM 推理。

0 人收藏 0 人点赞
#acceleration

PARD-2:面向双模态投机解码的目标对齐并行草稿模型

arXiv cs.CL · 2026-05-12 缓存

本文介绍了 PARD-2,这是一种双模态投机解码框架,利用目标对齐的并行草稿模型加速大语言模型(LLM)推理,在 Llama 3.1-8B 上实现了最高 6.94 倍的无损加速。

0 人收藏 0 人点赞
#acceleration

DARE:通过复用扩散语言模型激活实现高效推理

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 DARE,这是一种通过复用缓存的键值(KV)和输出激活来减少计算冗余,从而在几乎不损失质量的情况下提高扩散大语言模型推理效率的方法。

0 人收藏 0 人点赞
#acceleration

SpecBlock:具有动态树草拟的块迭代投机解码

arXiv cs.CL · 2026-05-11 缓存

本文介绍了 SpecBlock,这是一种块迭代式投机解码方法,通过将路径依赖与高效的草拟相结合来加速大语言模型的推理。与 EAGLE-3 等现有方法相比,它在保持更低草拟成本的同时展示了更高的加速比。

0 人收藏 0 人点赞
#acceleration

归一化轨迹模型

Hugging Face Daily Papers · 2026-05-08 缓存

本文介绍了归一化轨迹模型(NTM),这是一种基于扩散生成的新颖方法,它将反向步骤建模为具有精确似然训练的有条件归一化流。NTM 仅需四个步骤即可实现高质量的文本到图像生成,同时保留了似然框架,在标准基准测试中优于基线方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈