scalability

标签

Cards List
#scalability

TerminalWorld:在真实终端任务中评估智能体的基准

Hugging Face Daily Papers · 2026-05-21 缓存

本文介绍了TerminalWorld,这是一个基于80,870个终端记录构建的、用于在真实终端任务中评估AI智能体的基准。当前系统最高仅达到62.5%的通过率,凸显了真实终端工作流中的挑战。

0 人收藏 0 人点赞
#scalability

@dkare1009: 如何为可扩展性和效率构建您的生成式AI项目…

X AI KOLs Timeline · 2026-05-20 缓存

关于如何构建可扩展且高效的生成式AI项目的指南,涵盖目录组织、配置、数据管理和代码结构。

0 人收藏 0 人点赞
#scalability

投影潜在强化学习动作:迈向通用的、可扩展的图组合优化

arXiv cs.AI · 2026-05-20

本文介绍了用于图组合优化的投影智能体,采用强化学习和图神经网络,在连续动作嵌入空间中运行,以提升泛化能力和可扩展性,并发布了LaGCO-RL库。

0 人收藏 0 人点赞
#scalability

将文档AI投入生产:面向OCR与LLM管道的微服务架构

arXiv cs.AI · 2026-05-20 缓存

本文提出了一种面向生产级文档AI管道的微服务架构,该架构结合了分类、OCR和LLM提取,分享了设计决策和批量分析洞察,揭示了OCR(而非LLM解析)主导了延迟。

0 人收藏 0 人点赞
#scalability

每个AI提示都需花费成本——这改变了一切

Reddit r/AI_Agents · 2026-05-18

文章认为,AI的真正挑战不仅在于构建更智能的模型,更在于以规模化的方式降低成本效率,强调了减少token使用、提升速度以及优化基础设施的重要性。

0 人收藏 0 人点赞
#scalability

Transformer 可扩展性危机:现代语言模型中性能墙的首次全面实证分析

arXiv cs.LG · 2026-05-18 缓存

本文对 118 个 Transformer 模型进行了首次大规模实证分析,揭示了关键的性能墙,其中成功率从 512 token 时的 88.1% 下降到 2048 token 时的 0%,挑战了主流的缩放假设。

0 人收藏 0 人点赞
#scalability

从LLM生成的猜想到Lean形式化验证:基于平方和证书的自动多项式不等式证明

arXiv cs.AI · 2026-05-18 缓存

本文提出了NSPI,一种结合LLM与符号计算的神经符号框架,用于证明多项式不等式。它利用LLM生成的平方和猜想,通过符号计算进行精炼,并在Lean中形式化验证证明,在最多10个变量的多项式上展示了可扩展性。

0 人收藏 0 人点赞
#scalability

想分享一个关于创建和评估AI自动化的框架

Reddit r/AI_Agents · 2026-05-18

作者创建了一个名为 agent-automation-creator 的仓库,这是一个用于构建和评估可靠、可扩展的AI自动化的框架,现寻求社区反馈。

0 人收藏 0 人点赞
#scalability

团队在用量开始增长时如何管理OpenAI成本?

Reddit r/ArtificialInteligence · 2026-05-17

团队在扩展OpenAI用量时面临理解每个功能、团队和客户的成本驱动因素的挑战,通常依赖手动记录或像Finout这样的工具进行成本分配和异常检测。

0 人收藏 0 人点赞
#scalability

我们如何构建安全、可扩展的代理沙箱基础设施(8分钟阅读)

TLDR AI · 2026-05-15 缓存

Browser Use 描述了隔离执行代码的 AI 代理的两种模式:隔离工具与隔离代理。他们使用 AWS 上的 Unikraft 微虚拟机实现了代理隔离模式,获得了安全、可扩展且一次性的沙箱。

0 人收藏 0 人点赞
#scalability

用于可扩展视觉 Transformer 的弹性注意力核 [R]

Reddit r/MachineLearning · 2026-05-13

本文介绍了一篇关于视觉 Transformer 弹性注意力核的新论文,提出了一种核心-外围块稀疏注意力结构,与 DINOv3 等密集自注意力方法相比,该结构提高了可扩展性和准确率。

0 人收藏 0 人点赞
#scalability

学习局部通信以解决大规模多智能体路径规划

Hugging Face Daily Papers · 2026-05-12 缓存

本文介绍了LC-MAPF,一种带有可学习通信模块的预训练模型,用于多智能体路径规划,它改善了协调性,并在保持可扩展性的同时优于现有基于学习的求解器。

0 人收藏 0 人点赞
#scalability

Interfaze:专为规模化场景下高准确率而构建的新型模型架构

Hacker News Top · 2026-05-11 缓存

Interfaze 推出了一种混合 AI 模型架构,结合 CNN/DNN 的专项优势与 Transformer 能力,在 OCR 和翻译等确定性任务上实现卓越精度,同时在规模化应用中保持成本效率。

0 人收藏 0 人点赞
#scalability

@katelyn_lesse:与 dan 和 @every 团队相处非常有趣——他们对 AGI 深信不疑,因此能洞察到瓶颈所在……

X AI KOLs Following · 2026-05-10 缓存

作者指出,Every 团队高度专注于 AGI,并认为基础设施是关键的瓶颈,预测随着 Claude 等模型的进步,这一问题将变得更加严峻。

0 人收藏 0 人点赞
#scalability

@smratitiwa86867: 这太疯狂了。前谷歌工程师刚刚发布了他们内部工具的完整地图……以及你可以直接使用的精确开源版本……

X AI KOLs Timeline · 2026-05-08

前谷歌工程师发布了一张谷歌内部工具及其开源替代品的地图,为构建可扩展的基础设施提供了秘籍。

0 人收藏 0 人点赞
#scalability

用于多重图可扩展路由的两阶段学习分解

arXiv cs.LG · 2026-05-08 缓存

本文提出了节点-边策略分解(NEPF)方法,以解决多重图上车辆路径问题(VRP)的可扩展性难题。该方法结合了预编码边聚合与分层强化学习,在加快训练和推理速度的同时,实现了最先进的求解质量。

0 人收藏 0 人点赞
#scalability

使用 Postgres 作为作业队列的潜在后果

Lobsters Hottest · 2026-05-07 缓存

文章分析了使用 PostgreSQL 作为作业队列的可扩展性限制,特别强调了高并发下 MultiXact SLRU 争用导致的性能瓶颈。文章解释了为什么这种架构在开发环境中表现良好,但在生产环境中却会失败,并建议考虑替代方案。

0 人收藏 0 人点赞
#scalability

@BenjDicken:分片就是:1)数据库可扩展性的基石 2)架构层面超有趣 想设计数据……

X AI KOLs Timeline · 2026-04-19 缓存

Ben Dicken 强调,分片是构建可扩展数据库和设计数据密集型应用的关键。

0 人收藏 0 人点赞
#scalability

扩展我们构建和测试最先进 AI 的方式

Meta AI Blog · 2026-04-07

随着 AI 模型变得越来越强大且个性化,本文探讨了可靠性、安全性以及用户保护日益增长的重要性。

0 人收藏 0 人点赞
#scalability

OpenAI通过每次交互改进支持服务

OpenAI Blog · 2025-09-29 缓存

OpenAI分享了如何使用AI重新设计其支持运营,每年处理数百万个请求,建立了一个每次交互都能改进下一次的运营模式。该方法整合了聊天、邮件和电话等多个渠道,持续改进知识库,并通过人工-AI评估循环使支持代表能够充当建设者并为产品改进提供信息。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈