efficiency

标签

Cards List
#efficiency

@DashHuang: 感觉 Fable 5 给自己开了天眼,在有限的几天里,把自己的生产环境整舒服了,最近一个月用掉了 100 亿 Token。创业 20 多年,团队从 20 人到 200 人 到 2000 人,但是做产品从来没那么爽过,效率和产出从来没那么高…

X AI KOLs Following · 昨天 缓存

初创公司创始人分享使用Fable 5后极大提升生产效率,一个月消耗100亿Token,团队规模从20人到2000人,产出创新高。

0 人收藏 0 人点赞
#efficiency

@BohuTANG: 之前还想跨模型互相做 Review,这个方式对我来说太慢了,现在发现了一个新的方式:/harden ,同一个模型两轮收敛,效果非常好 ,感兴趣的可以试试这个skill

X AI KOLs Timeline · 昨天 缓存

BohuTANG introduces /harden, a method for same-model two-round convergence, and highlights the evot agent engine which completes complex tasks with fewer tokens and lower cost than alternatives like Claude Code.

0 人收藏 0 人点赞
#efficiency

HAKARI-Bench:在统一条件下比较检索架构和效率设置的轻量级基准测试

Hugging Face Daily Papers · 昨天 缓存

HAKARI-Bench是一个轻量级基准测试,用于在多种配置和语言下比较检索方法,支持高效的模型选择和性能分析。它能在保持高相关性的同时,比运行完整基准测试(如MTEB)更快地复现其结果。

0 人收藏 0 人点赞
#efficiency

Unlimited OCR 的工作原理

Hugging Face Daily Papers · 昨天 缓存

Unlimited OCR 引入了 Reference Sliding Window Attention,以消除长序列 OCR 任务中不断增长的内存消耗,从而能够在单次前向传播中高效转录多页文档。

0 人收藏 0 人点赞
#efficiency

PolicyTrim: 提升视觉-语言-动作模型的本征策略效率

Hugging Face Daily Papers · 2天前 缓存

PolicyTrim是一种基于强化学习的后训练框架,能将视觉-语言-动作模型的动作块利用率提升3倍,并将物理执行步骤减少51.4%,实现高达5.83倍的部署加速。

0 人收藏 0 人点赞
#efficiency

@AnatoliKopadze: https://x.com/AnatoliKopadze/status/2068328135611822149

X AI KOLs Timeline · 3天前 缓存

本文解释了在AI交互中使用循环的概念,即AI围绕一个目标进行迭代而非单次提示,并讨论了验证、状态和停止条件等关键组成部分。

0 人收藏 0 人点赞
#efficiency

GLM 5.2: 使用不到一半的令牌即可达到最高级别智能的98%

Reddit r/LocalLLaMA · 3天前

GLM 5.2 提供了改进的令牌效率,让用户能够使用不到一半的令牌即可达到最高级别智能的98%。与资源密集型的‘最高’级别相比,模型的‘高’努力级别为日常使用提供了一个实用的替代方案。

0 人收藏 0 人点赞
#efficiency

粒度是有代价的 – 博弈论

Hacker News Top · 4天前 缓存

一篇博客文章,讨论了系统中增加粒度(例如金融市场的最小变动单位和预订运动场地的时间段)如何引入策略性博弈和低效,认为更细化的选择并不总是有益的。

0 人收藏 0 人点赞
#efficiency

一家初创公司声称突破了限制大语言模型的瓶颈

MIT Technology Review · 4天前 缓存

总部位于迈阿密的初创公司 Subquadratic 声称其新模型 SubQ 解决了二次注意力瓶颈问题,使大语言模型更快、更便宜。Appen 的独立测试证实了其中许多说法,但质疑依然存在。

0 人收藏 0 人点赞
#efficiency

通过人类偏好奖励改进文本到音乐生成

Hugging Face Daily Papers · 4天前 缓存

本文提出了一种文本到音乐生成系统,利用奖励条件、专家迭代和偏好调优,在120M参数模型中提升音频质量,该模型提交至ICME 2026 ATTM Grand Challenge。

0 人收藏 0 人点赞
#efficiency

人人都说AI需要更多GPU。我分析了一个GPU,发现它大部分时间都在闲置,只是在等待数据。所谓"GPU短缺"中,有多少实际上是GPU被浪费了?

Reddit r/artificial · 5天前

分析表明,用于AI训练的GPU经常处于闲置等待数据的状态,这让人质疑GPU短缺问题的严重性。

0 人收藏 0 人点赞
#efficiency

@rohanpaul_ai: 这篇论文提出了一个大胆的主张,对‘更多测试时计算应持续带来帮助’的普遍观点提出了挑战。声称一个代码…

X AI KOLs Following · 5天前 缓存

本文介绍了 LoopCoder-v2,一个 7B 代码模型,该模型从单次重新思考循环中获益最大;额外的循环会降低性能,挑战了‘更多测试时计算总是有帮助’的假设。

0 人收藏 0 人点赞
#efficiency

AI自动化真的在工作上帮到你了吗,还是我们只是在疯狂烧token预算来为裁员找借口?

Reddit r/AI_Agents · 5天前

反思了企业AI自动化的混合影响,指出效率提升常被用作裁员的借口,而token预算可能造成浪费。同时提出了关于AI代理访问工作通信平台的数据隐私担忧。

0 人收藏 0 人点赞
#efficiency

Grouped Query Experts: GQA自注意力上的混合专家模型

Hugging Face Daily Papers · 5天前 缓存

Grouped Query Experts (GQE) 通过在分组查询注意力之上应用混合专家层来提高Transformer效率,每个token有选择地激活查询头,同时保持键值缓存优势,在2.5亿参数规模下,以一半的查询头计算量达到与基线相同的准确率。

0 人收藏 0 人点赞
#efficiency

构建一个始终低算力的智能系统。

Reddit r/ArtificialInteligence · 5天前

本文介绍了Buddy AI,一个始终低算力的智能系统,旨在严格的计算限制下运行,专注于效率和基于事实的输出,而非扩展模型。

0 人收藏 0 人点赞
#efficiency

@dair_ai: 关于计算机使用智能体的杰出论文。(收藏)计算机使用智能体通过屏幕操控真实软件,……

X AI KOLs Following · 5天前 缓存

PreAct 将成功的智能体运行编译成小型状态机程序,在重复任务上实现 8.5-13 倍更快的重放,无需逐步骤的语言模型调用,并通过运行时屏幕检查确保正确性。

0 人收藏 0 人点赞
#efficiency

@vikingmute: 发现这个 Ponytail 和 Codex 是绝配了https://github.com/DietrichGebert/ponytail… GPT 写兜底代码上瘾了,没有明确指示总是写一大堆防御性代码,看的想哭。 它的核心理念是 “The…

X AI KOLs Timeline · 6天前 缓存

Ponytail是一个AI代理技能,通过强制代理先检查是否需要写新代码来大幅减少过度工程,声称能减少80-94%的代码量和42-75%的成本。作者推荐与Codex搭配使用,并已在GitHub上开源。

0 人收藏 0 人点赞
#efficiency

@DorothyDDU: LoopCoder-v2 已发布 Loop Transformers 重复使用同一个块进行循环隐藏状态优化——让模型“思考”更多……

X AI KOLs Timeline · 6天前 缓存

本文介绍了LoopCoder-v2,一个70亿参数的并行循环变换器系列,用于代码生成,并研究了最优循环次数,发现两个循环能带来显著提升,而更多循环则会导致性能下降。

0 人收藏 0 人点赞
#efficiency

AI让我更高效,但不知为何更累了

Reddit r/artificial · 6天前

个人反思:AI工具提高了生产力,但也抬高了期望,导致工作量增加和心理疲劳,而非获得更多空闲时间。

0 人收藏 0 人点赞
#efficiency

PreAct: 能够更快处理重复任务的计算机操控智能体

arXiv cs.AI · 6天前 缓存

PreAct 将计算机操控智能体的成功任务执行编译为小型状态机程序,通过跳过每步的语言模型调用,实现重复任务上的快速重放(快 8.5–13 倍),同时每一步验证屏幕状态,并在出现不匹配时回退到智能体。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈