标签
一篇博客文章分析了M/M/c队列模型,并表明在负载均衡系统中增加服务器数量,在恒定每服务器负载下可以改善延迟,这是云经济学中一个有益且有些违反直觉的结果。
本文认为,像 Harper 语法检查器这样的本地优先软件通过在设备上运行代码来避免扩展问题,使其能够在无需额外服务器成本的情况下轻松应对流量高峰。
本文解释了为什么在Postgres中进行大规模DELETE操作效率低下且会增加额外工作,并建议使用DROP TABLE或TRUNCATE作为批量数据删除的更可扩展的替代方案。
本文提出RACES,一种递归自动组合框架,将可验证环境视为可组合的构建块,以扩展LLM的强化学习规模,通过组合算子实现高效的推理泛化。
本文扩展了MST-Direct方法(一种使用Sinkhorn最优传输进行多元地质统计模拟的方法),从双变量无条件小网格设置扩展到多元、条件和大规模设置,精确保持联合分布,并优于现有方法。
亚马逊讨论了扁平数据中心网络拓扑结构的演进,从理论上的扩张图到实际实现(如VL2和Jellyfish),以及在AWS中基于彭罗斯铺砌设计的当前研究。
匿名爆料称某机器人公司因算法规模化成本过高且尝试VLA、world model和RL均无效,已放弃科研投入,转而制造大型机器人玩具欺骗投资者。
讨论AI代理是否应基于用户当前需求推荐工具,还是考虑未来的可扩展性,以及如何沟通潜在的长期限制。
本文认为,表示学习(而非基于模型的规划)是可扩展多任务深度强化学习的关键。文章介绍了MR.Q,一种简单的无模型算法,通过辅助预测目标,在多种连续控制任务上优于之前基于世界模型的方法。
作者讨论了在规模化处理非结构化数据时,代理集群/工作流的使用日益增长,并指出当并行部署超过30个子代理时,可靠执行会显著下降,同时预告了一种将智能决策与可靠任务执行相结合的解决方案。
研究人员提出了一种用于图生成的轻量级自回归框架,该框架使用结构引导的拓扑排序实现了接近对数线性的复杂度,解决了现有扩散和自回归方法在可扩展性和新颖性方面的局限性。该方法同时支持LSTM和Mamba风格的主干网络,在分子和非分子基准测试中展示了改进的新颖性,同时保持了有效性和独特性。
一个全面的系统设计大师树,涵盖从基础知识到实际应用的各个方面,包括架构模式、数据库、缓存、消息系统、API设计和部署策略。旨在作为软件工程师的结构化学习指南。
介绍了MASC(边际自校正),一种用于大型语言模型的高效遗忘方法,采用在线停止规则,以降低的计算成本实现有竞争力的遗忘-保持权衡,并在TOFU和MUSE基准上得到验证。
马丁·卡萨多的一条推文,强调了一种解决方案,该方案解决了大规模向AI智能体暴露追踪数据这一难题,并平衡了成本与AI的杠杆作用。
介绍原子分解与重组(ADR),一种通过分解和重组原子元素来生成新颖且具有挑战性的可验证代码任务的框架,从而为大型语言模型实现可扩展的基于可验证奖励的强化学习。
本文介绍网络流量分析工具 Akvorado 如何通过实现分片来扩展其 BMP 路由信息库(RIB),以处理数千万条路由,并提升并发更新性能。
本文介绍了可计算公平分配(CFD)框架,该框架利用Boltzmann-Softmax控制在AI资源分配中平衡效率与公平性,并通过AHC++实现实时自适应。
一份全面的系统设计模式速查表,涵盖12种模式,适用于技术面试,包括每种模式的信号、构建块和深入探讨,基于对顶尖科技公司200多次面试的经验总结。
本文介绍了TerminalWorld,这是一个基于80,870个终端记录构建的、用于在真实终端任务中评估AI智能体的基准。当前系统最高仅达到62.5%的通过率,凸显了真实终端工作流中的挑战。