scalability

#scalability

TerminalWorld：在真实终端任务中评估智能体的基准

Hugging Face Daily Papers ↗ · 2026-05-21 缓存

本文介绍了TerminalWorld，这是一个基于80,870个终端记录构建的、用于在真实终端任务中评估AI智能体的基准。当前系统最高仅达到62.5%的通过率，凸显了真实终端工作流中的挑战。

0 人收藏 0 人点赞

#scalability

@dkare1009: 如何为可扩展性和效率构建您的生成式AI项目…

X AI KOLs Timeline ↗ · 2026-05-20 缓存

关于如何构建可扩展且高效的生成式AI项目的指南，涵盖目录组织、配置、数据管理和代码结构。

0 人收藏 0 人点赞

#scalability

投影潜在强化学习动作：迈向通用的、可扩展的图组合优化

arXiv cs.AI ↗ · 2026-05-20

本文介绍了用于图组合优化的投影智能体，采用强化学习和图神经网络，在连续动作嵌入空间中运行，以提升泛化能力和可扩展性，并发布了LaGCO-RL库。

0 人收藏 0 人点赞

#scalability

将文档AI投入生产：面向OCR与LLM管道的微服务架构

arXiv cs.AI ↗ · 2026-05-20 缓存

本文提出了一种面向生产级文档AI管道的微服务架构，该架构结合了分类、OCR和LLM提取，分享了设计决策和批量分析洞察，揭示了OCR（而非LLM解析）主导了延迟。

0 人收藏 0 人点赞

#scalability

每个AI提示都需花费成本——这改变了一切

Reddit r/AI_Agents ↗ · 2026-05-18

文章认为，AI的真正挑战不仅在于构建更智能的模型，更在于以规模化的方式降低成本效率，强调了减少token使用、提升速度以及优化基础设施的重要性。

0 人收藏 0 人点赞

#scalability

Transformer 可扩展性危机：现代语言模型中性能墙的首次全面实证分析

arXiv cs.LG ↗ · 2026-05-18 缓存

本文对 118 个 Transformer 模型进行了首次大规模实证分析，揭示了关键的性能墙，其中成功率从 512 token 时的 88.1% 下降到 2048 token 时的 0%，挑战了主流的缩放假设。

0 人收藏 0 人点赞

#scalability

从LLM生成的猜想到Lean形式化验证：基于平方和证书的自动多项式不等式证明

arXiv cs.AI ↗ · 2026-05-18 缓存

本文提出了NSPI，一种结合LLM与符号计算的神经符号框架，用于证明多项式不等式。它利用LLM生成的平方和猜想，通过符号计算进行精炼，并在Lean中形式化验证证明，在最多10个变量的多项式上展示了可扩展性。

0 人收藏 0 人点赞

#scalability

想分享一个关于创建和评估AI自动化的框架

Reddit r/AI_Agents ↗ · 2026-05-18

作者创建了一个名为 agent-automation-creator 的仓库，这是一个用于构建和评估可靠、可扩展的AI自动化的框架，现寻求社区反馈。

0 人收藏 0 人点赞

#scalability

团队在用量开始增长时如何管理OpenAI成本？

Reddit r/ArtificialInteligence ↗ · 2026-05-17

团队在扩展OpenAI用量时面临理解每个功能、团队和客户的成本驱动因素的挑战，通常依赖手动记录或像Finout这样的工具进行成本分配和异常检测。

0 人收藏 0 人点赞

#scalability

我们如何构建安全、可扩展的代理沙箱基础设施（8分钟阅读）

TLDR AI ↗ · 2026-05-15 缓存

Browser Use 描述了隔离执行代码的 AI 代理的两种模式：隔离工具与隔离代理。他们使用 AWS 上的 Unikraft 微虚拟机实现了代理隔离模式，获得了安全、可扩展且一次性的沙箱。

0 人收藏 0 人点赞

#scalability

用于可扩展视觉 Transformer 的弹性注意力核 [R]

Reddit r/MachineLearning ↗ · 2026-05-13

本文介绍了一篇关于视觉 Transformer 弹性注意力核的新论文，提出了一种核心-外围块稀疏注意力结构，与 DINOv3 等密集自注意力方法相比，该结构提高了可扩展性和准确率。

0 人收藏 0 人点赞

#scalability

学习局部通信以解决大规模多智能体路径规划

Hugging Face Daily Papers ↗ · 2026-05-12 缓存

本文介绍了LC-MAPF，一种带有可学习通信模块的预训练模型，用于多智能体路径规划，它改善了协调性，并在保持可扩展性的同时优于现有基于学习的求解器。

0 人收藏 0 人点赞

#scalability

Interfaze：专为规模化场景下高准确率而构建的新型模型架构

Hacker News Top ↗ · 2026-05-11 缓存

Interfaze 推出了一种混合 AI 模型架构，结合 CNN/DNN 的专项优势与 Transformer 能力，在 OCR 和翻译等确定性任务上实现卓越精度，同时在规模化应用中保持成本效率。

0 人收藏 0 人点赞

#scalability

@katelyn_lesse：与 dan 和 @every 团队相处非常有趣——他们对 AGI 深信不疑，因此能洞察到瓶颈所在……

X AI KOLs Following ↗ · 2026-05-10 缓存

作者指出，Every 团队高度专注于 AGI，并认为基础设施是关键的瓶颈，预测随着 Claude 等模型的进步，这一问题将变得更加严峻。

0 人收藏 0 人点赞

#scalability

@smratitiwa86867: 这太疯狂了。前谷歌工程师刚刚发布了他们内部工具的完整地图……以及你可以直接使用的精确开源版本……

X AI KOLs Timeline ↗ · 2026-05-08

前谷歌工程师发布了一张谷歌内部工具及其开源替代品的地图，为构建可扩展的基础设施提供了秘籍。

0 人收藏 0 人点赞

#scalability

用于多重图可扩展路由的两阶段学习分解

arXiv cs.LG ↗ · 2026-05-08 缓存

本文提出了节点-边策略分解（NEPF）方法，以解决多重图上车辆路径问题（VRP）的可扩展性难题。该方法结合了预编码边聚合与分层强化学习，在加快训练和推理速度的同时，实现了最先进的求解质量。

0 人收藏 0 人点赞

#scalability

使用 Postgres 作为作业队列的潜在后果

Lobsters Hottest ↗ · 2026-05-07 缓存

文章分析了使用 PostgreSQL 作为作业队列的可扩展性限制，特别强调了高并发下 MultiXact SLRU 争用导致的性能瓶颈。文章解释了为什么这种架构在开发环境中表现良好，但在生产环境中却会失败，并建议考虑替代方案。

0 人收藏 0 人点赞

#scalability

@BenjDicken：分片就是：1）数据库可扩展性的基石 2）架构层面超有趣想设计数据……

X AI KOLs Timeline ↗ · 2026-04-19 缓存

Ben Dicken 强调，分片是构建可扩展数据库和设计数据密集型应用的关键。

0 人收藏 0 人点赞

#scalability

扩展我们构建和测试最先进 AI 的方式

Meta AI Blog ↗ · 2026-04-07

随着 AI 模型变得越来越强大且个性化，本文探讨了可靠性、安全性以及用户保护日益增长的重要性。

0 人收藏 0 人点赞

#scalability

OpenAI通过每次交互改进支持服务

OpenAI Blog ↗ · 2025-09-29 缓存

OpenAI分享了如何使用AI重新设计其支持运营，每年处理数百万个请求，建立了一个每次交互都能改进下一次的运营模式。该方法整合了聊天、邮件和电话等多个渠道，持续改进知识库，并通过人工-AI评估循环使支持代表能够充当建设者并为产品改进提供信息。

0 人收藏 0 人点赞

scalability

提交意见反馈