标签
Anthropic在其Code with Claude开发者大会上发布了新的托管代理功能,用户只需提供成果和预算即可完成目标,Claude将作为可扩展的云计算机全天候运行代理任务。
Let's Encrypt 因潜在事件正在停止证书发放,同时进行计划的数据库维护,可能导致 ACME 客户端超时最长 10 分钟。
Modular发布了一篇博客文章,解释为什么传统的HTTP路由不适用于LLM推理工作负载。文章描述了他们如何在其分布式推理框架中处理有状态的异构GPU pod(包括KV缓存、专用的预填充/解码后端以及对话级路由),这些是传统无状态路由算法无法解决的。
一个X帖子认为生产级AI代理需要运维支撑框架(运维手册、权限、日志、回滚、验证),而不仅仅是更好的提示词。作者引用了DevOps演进历程,指出提示词提供建议而运维手册提供控制,代理系统需要平台工程解决方案来实现权限、状态管理、验证、可观测性和回滚能力。
对Claude的“托管代理”(Managed Agents)的分析,将其视为下一代AI基础设施层——“公司大脑”(Company Brain)的先兆。这是一个运营状态层,使代理和应用能够基于共享的公司上下文行动,与更简单的知识库或基于Markdown的原型形成对比。
前谷歌工程师发布了一张谷歌内部工具及其开源替代品的地图,为构建可扩展的基础设施提供了秘籍。
AWS位于弗吉尼亚北部的US-East-1区域发生数据中心宕机事件,原因是过热,影响了FanDuel和Coinbase交易平台,预计恢复需要数小时。
OpenHandsDev 推出了 Agent Control Plane,这是一个用于在整个组织中控制、观察和扩展数百个 AI 代理的系统。
E2B 强调了 Genspark 如何在12个月内实现2.5亿美元ARR,利用E2B的基础设施来支持其Super Agent,突出了低延迟沙箱对于AI智能体的重要性。
有报道称 Anthropic 与 SpaceX 合作,利用 Colossus 1 系统提高速率限制,不过这一说法似乎属于谣言或错误信息。
作者详细介绍了一款名为'Deptool'的自定义Python部署与配置管理工具的开发过程。该工具旨在比Ansible等现有方案更快、更可预测,源于对数字主权和更优工具的追求。
Andy Masley反驳了数据中心建设导致农田流失的论点,他引用数据指出,农民历史上出售了大量土地,但这并未影响粮食供应。
OpenAI 详细介绍了其重新架构的 WebRTC 技术栈,旨在为超过 9 亿用户提供大规模低延迟语音 AI 服务。文章阐述了全新的 split-relay 和 transceiver 架构如何优化媒体路由与连接建立,以支持 ChatGPT 语音等实时交互场景。
Andrew Ng 讨论了编码代理如何以不同速度加速不同类型的软件工作,其中前端开发受益最大,研究受益最小。
2025 年被归档后,Meta 接管了 jemalloc 仓库,让这个曾经停滞的 malloc 实现重新恢复维护。