标签
讨论2026年GPU访问持续碎片化的问题,并提出是否存在更好的计算市场结构。
a16z 发布深度文章,认为 SpaceX 正将太空变为 AI 基础设施的关键部分,因为 AI 的瓶颈是能源,而轨道、月球和火星将成为未来的数据中心。
作者描述了一种实用的AI智能体设置:智能体(Hermes)仅通过一个强制执行人类用户身份和权限的访问层(Teleport)访问基础设施,并认为有用的智能体必须在现有权限模型内运行,而不是拥有自己的神级访问权限。
一项推测性分析认为,如果AI能力达到平台期并成为商品化的公用事业,中国快速扩展能源基础设施和以更低成本生产token的能力可能使其主导全球AI市场,类似于制造业的外包。
圈内程序员将Hermes视为下一代AI Agent的标准底座,介绍了多个相关项目如Honcho(记忆引擎)、Hermes Web Search Plus(智能检索)、NemoClaw(企业级扩展)等,旨在为Agent提供持久记忆和结构化能力。
一位从UCLA辍学的创业创始人的个人反思:构建AI基础设施如何改变了他对世界不完美根基的看法。
Ivan Burazin 认为,"Sandbox" 这个名称对他们的产品具有误导性,实际上它是一台可组合的计算机,允许 AI 代理即时定义自己的硬件配置——CPU、内存、磁盘、GPU 和操作系统——并瞬间组装完成。
SemiAnalysis 驳斥了广泛流传的关于2026年美国数据中心容量一半被延迟或取消的说法,指出这是基于不准确的模型,并用自己的数据表明预测仅略有变化。
Baseten是一家估值130亿美元的AI初创公司,为使用低成本AI模型替代OpenAI和Anthropic的企业提供软件和计算能力。
一项分析指出,公司在人工智能方面失败的原因在于它们专注于模型,而非基础层——流程设计、治理、知识架构、人工判断和反馈循环——而这些才是真正的价值来源。文章引用了纳德拉的“令牌资本”概念、苹果可切换模型的Siri,以及显示战略与执行之间存在巨大差距的调查数据。
Marc Andreessen将SpaceX重新定义为将AI、能源和太空整合的文明基础设施公司,而非单纯的火箭发射公司。
mirrors.wikimedia.org 将于5月15日关闭,主要影响手动配置其为 Debian/Ubuntu APT 镜像的用户;大多数用户可以切换到其他镜像。
一起大规模泄密事件暴露了包括一家北约国防承包商在内的数千个敏感网络的凭证,攻击者使用一个45-GPU集群破解VPN认证哈希,并入侵了Active Directory环境。
本文讨论了为 AI 智能体添加网络层的概念,即在现有工具和向量存储的基础上,实现智能体之间更好的协调和通信。
Garry Tan 认为,为 AI 智能体使用数据库就像建造富士康工厂,暗示这不足以实现正常的智能体功能。
a16z 播客邀请前合伙人 Benedict Evans 探讨 AI 与 1997 年互联网的类比,指出当前 AI 基础设施投资巨大但 ROI 不明,历史经验表明价值会向上层转移,模型本身难以获得差异化利润。
关于运行AI代理所需基础设施缺失的讨论,包括监控、权限、恢复和审计追踪,质疑这是否会成为新的基础设施类别。