efficiency

#efficiency

@DashHuang: 感觉 Fable 5 给自己开了天眼，在有限的几天里，把自己的生产环境整舒服了，最近一个月用掉了 100 亿 Token。创业 20 多年，团队从 20 人到 200 人到 2000 人，但是做产品从来没那么爽过，效率和产出从来没那么高…

X AI KOLs Following ↗ · 昨天缓存

初创公司创始人分享使用Fable 5后极大提升生产效率，一个月消耗100亿Token，团队规模从20人到2000人，产出创新高。

0 人收藏 0 人点赞

#efficiency

@BohuTANG: 之前还想跨模型互相做 Review，这个方式对我来说太慢了，现在发现了一个新的方式：/harden ，同一个模型两轮收敛，效果非常好，感兴趣的可以试试这个skill

X AI KOLs Timeline ↗ · 昨天缓存

BohuTANG introduces /harden, a method for same-model two-round convergence, and highlights the evot agent engine which completes complex tasks with fewer tokens and lower cost than alternatives like Claude Code.

0 人收藏 0 人点赞

#efficiency

HAKARI-Bench：在统一条件下比较检索架构和效率设置的轻量级基准测试

Hugging Face Daily Papers ↗ · 昨天缓存

HAKARI-Bench是一个轻量级基准测试，用于在多种配置和语言下比较检索方法，支持高效的模型选择和性能分析。它能在保持高相关性的同时，比运行完整基准测试（如MTEB）更快地复现其结果。

0 人收藏 0 人点赞

#efficiency

Unlimited OCR 的工作原理

Hugging Face Daily Papers ↗ · 昨天缓存

Unlimited OCR 引入了 Reference Sliding Window Attention，以消除长序列 OCR 任务中不断增长的内存消耗，从而能够在单次前向传播中高效转录多页文档。

0 人收藏 0 人点赞

#efficiency

PolicyTrim: 提升视觉-语言-动作模型的本征策略效率

Hugging Face Daily Papers ↗ · 2天前缓存

PolicyTrim是一种基于强化学习的后训练框架，能将视觉-语言-动作模型的动作块利用率提升3倍，并将物理执行步骤减少51.4%，实现高达5.83倍的部署加速。

0 人收藏 0 人点赞

#efficiency

@AnatoliKopadze: https://x.com/AnatoliKopadze/status/2068328135611822149

X AI KOLs Timeline ↗ · 3天前缓存

本文解释了在AI交互中使用循环的概念，即AI围绕一个目标进行迭代而非单次提示，并讨论了验证、状态和停止条件等关键组成部分。

0 人收藏 0 人点赞

#efficiency

GLM 5.2: 使用不到一半的令牌即可达到最高级别智能的98%

Reddit r/LocalLLaMA ↗ · 3天前

GLM 5.2 提供了改进的令牌效率，让用户能够使用不到一半的令牌即可达到最高级别智能的98%。与资源密集型的‘最高’级别相比，模型的‘高’努力级别为日常使用提供了一个实用的替代方案。

0 人收藏 0 人点赞

#efficiency

粒度是有代价的 – 博弈论

Hacker News Top ↗ · 4天前缓存

一篇博客文章，讨论了系统中增加粒度（例如金融市场的最小变动单位和预订运动场地的时间段）如何引入策略性博弈和低效，认为更细化的选择并不总是有益的。

0 人收藏 0 人点赞

#efficiency

一家初创公司声称突破了限制大语言模型的瓶颈

MIT Technology Review ↗ · 4天前缓存

总部位于迈阿密的初创公司 Subquadratic 声称其新模型 SubQ 解决了二次注意力瓶颈问题，使大语言模型更快、更便宜。Appen 的独立测试证实了其中许多说法，但质疑依然存在。

0 人收藏 0 人点赞

#efficiency

通过人类偏好奖励改进文本到音乐生成

Hugging Face Daily Papers ↗ · 4天前缓存

本文提出了一种文本到音乐生成系统，利用奖励条件、专家迭代和偏好调优，在120M参数模型中提升音频质量，该模型提交至ICME 2026 ATTM Grand Challenge。

0 人收藏 0 人点赞

#efficiency

人人都说AI需要更多GPU。我分析了一个GPU，发现它大部分时间都在闲置，只是在等待数据。所谓"GPU短缺"中，有多少实际上是GPU被浪费了？

Reddit r/artificial ↗ · 5天前

分析表明，用于AI训练的GPU经常处于闲置等待数据的状态，这让人质疑GPU短缺问题的严重性。

0 人收藏 0 人点赞

#efficiency

@rohanpaul_ai: 这篇论文提出了一个大胆的主张，对‘更多测试时计算应持续带来帮助’的普遍观点提出了挑战。声称一个代码…

X AI KOLs Following ↗ · 5天前缓存

本文介绍了 LoopCoder-v2，一个 7B 代码模型，该模型从单次重新思考循环中获益最大；额外的循环会降低性能，挑战了‘更多测试时计算总是有帮助’的假设。

0 人收藏 0 人点赞

#efficiency

AI自动化真的在工作上帮到你了吗，还是我们只是在疯狂烧token预算来为裁员找借口？

Reddit r/AI_Agents ↗ · 5天前

反思了企业AI自动化的混合影响，指出效率提升常被用作裁员的借口，而token预算可能造成浪费。同时提出了关于AI代理访问工作通信平台的数据隐私担忧。

0 人收藏 0 人点赞

#efficiency

Grouped Query Experts: GQA自注意力上的混合专家模型

Hugging Face Daily Papers ↗ · 5天前缓存

Grouped Query Experts (GQE) 通过在分组查询注意力之上应用混合专家层来提高Transformer效率，每个token有选择地激活查询头，同时保持键值缓存优势，在2.5亿参数规模下，以一半的查询头计算量达到与基线相同的准确率。

0 人收藏 0 人点赞

#efficiency

构建一个始终低算力的智能系统。

Reddit r/ArtificialInteligence ↗ · 5天前

本文介绍了Buddy AI，一个始终低算力的智能系统，旨在严格的计算限制下运行，专注于效率和基于事实的输出，而非扩展模型。

0 人收藏 0 人点赞

#efficiency

@dair_ai: 关于计算机使用智能体的杰出论文。（收藏）计算机使用智能体通过屏幕操控真实软件，……

X AI KOLs Following ↗ · 5天前缓存

PreAct 将成功的智能体运行编译成小型状态机程序，在重复任务上实现 8.5-13 倍更快的重放，无需逐步骤的语言模型调用，并通过运行时屏幕检查确保正确性。

0 人收藏 0 人点赞

#efficiency

@vikingmute: 发现这个 Ponytail 和 Codex 是绝配了https://github.com/DietrichGebert/ponytail… GPT 写兜底代码上瘾了，没有明确指示总是写一大堆防御性代码，看的想哭。它的核心理念是 “The…

X AI KOLs Timeline ↗ · 6天前缓存

Ponytail是一个AI代理技能，通过强制代理先检查是否需要写新代码来大幅减少过度工程，声称能减少80-94%的代码量和42-75%的成本。作者推荐与Codex搭配使用，并已在GitHub上开源。

0 人收藏 0 人点赞

#efficiency

@DorothyDDU: LoopCoder-v2 已发布 Loop Transformers 重复使用同一个块进行循环隐藏状态优化——让模型“思考”更多……

X AI KOLs Timeline ↗ · 6天前缓存

本文介绍了LoopCoder-v2，一个70亿参数的并行循环变换器系列，用于代码生成，并研究了最优循环次数，发现两个循环能带来显著提升，而更多循环则会导致性能下降。

0 人收藏 0 人点赞

#efficiency

AI让我更高效，但不知为何更累了

Reddit r/artificial ↗ · 6天前

个人反思：AI工具提高了生产力，但也抬高了期望，导致工作量增加和心理疲劳，而非获得更多空闲时间。

0 人收藏 0 人点赞

#efficiency

PreAct: 能够更快处理重复任务的计算机操控智能体

arXiv cs.AI ↗ · 6天前缓存

PreAct 将计算机操控智能体的成功任务执行编译为小型状态机程序，通过跳过每步的语言模型调用，实现重复任务上的快速重放（快 8.5–13 倍），同时每一步验证屏幕状态，并在出现不匹配时回退到智能体。

0 人收藏 0 人点赞

efficiency

提交意见反馈