标签
Netflix 描述了将其批处理计算工作负载从自定义解决方案(CMB)迁移到 Kueue(一个 Kubernetes 原生的作业排队系统),以简化管理并利用 Kubernetes 生态系统。
一场比较Hyperagent等云原生代理平台与OpenClaw等本地优先方法安全风险的讨论,突显了便利性与控制权之间的权衡。
文章回顾了OpenClaw Agent框架的设计亮点与不足,并阐述了作者设计更好的Agent框架FastClaw的经验总结,强调云原生、轻量、多租户等原则。
美国运通描述了其核心支付生态系统采用的单元化架构,该架构能够隔离故障、降低延迟并扩展容量。这种方法将微服务和数据库分组到独立的单元中,以限制爆炸半径。
一位求职者发现,小型初创公司采用 Kubernetes 并非出于技术可扩展性,而是为了组织层面的好处,如一致性、共享知识和可追溯性。这篇文章反思了 Kubernetes 对小型团队的非技术优势。
GeoLibre 1.0 是一个轻量级、云原生的GIS平台,用于可视化、探索和分析地理空间数据,采用现代Web技术构建,并可在桌面和Web环境中运行。
一位前 Atlassian 工程师详细回顾了他八年的工作历程,在被裁员前,他参与构建了多个技术系统,包括一个 Open Service Broker、一个基于 Envoy 的控制平面 Sovereign,以及 AWS 上的大规模代理基础设施。
OpenTelemetry 已从 CNCF 毕业,其用于追踪 LLM 调用的 GenAI 语义约定是目前最活跃的子规范,在 v1.37 到 v1.41 的多个版本中持续演进。
Higgsfield AI 推出了 Supercomputer,一个云原生的自学习 AI 智能体,能够将任务分解为子任务,并将每个子任务分配给最适合的模型(例如,推理任务交给 Opus,视频任务交给 Seedance,图像任务交给 GPT),并配备三层记忆机制,实现跨会话的上下文持久化。
回顾2023-24年碎片化的AI工具格局,用户强调了Higgsfield AI的Supercomputer的到来,这是一种云原生AI代理,整合了40多种工具用于端到端任务执行。
Modal 工程师详细介绍了他们实现真正无服务器 GPU 用于 AI 推理的方法,结合了云缓冲区、自定义内容寻址文件系统以及 CPU/GPU 检查点/恢复,从而在几十秒内(而不是几分钟)扩展副本。
SREGym 是一个针对 AI SRE 智能体的实时、高保真基准测试平台,它利用现实世界中的云原生技术栈模拟复杂的生产环境故障场景。
IREN以6.25亿美元收购Mirantis,将其云原生Kubernetes和AI基础设施软件整合到IREN的数据中心,旨在提供完整的AI云平台。
Kubernetes v1.36 "Haru" 携 70 项增强正式发布,其中 18 项进入稳定版,25 项进入 Beta,25 项为 Alpha,同时包含若干弃用与移除。
字节跳动已将其高性能 Kubernetes 调度器 Gödel 开源,贡献给开源社区。
NVIDIA正将其GPU动态资源分配(DRA)驱动捐赠给CNCF及Kubernetes社区,使其从厂商主导转变为社区所有。此次捐赠旨在简化Kubernetes中面向AI工作负载的GPU资源管理,并通过与CNCF Confidential Containers社区的协作,为Kata Containers提供GPU支持。
Meshery 是一个开源的云原生服务网格和 Kubernetes 管理工具,提供了用于设计和基础设施管理的可视化平台。