标签
Webernetes 是 ngrok 开发的一个开源库,使用 TypeScript 在浏览器中模拟 Kubernetes 集群,无需后端基础设施即可实现交互式 Kubernetes 内容。
与CI/CD专家Robert Erez的播客对话探讨了AI如何重塑CI/CD实践、GitOps的细微差别,以及临时环境和渐进式交付等趋势。
一条推文强调了对Kubernetes的精彩介绍,并引用了Fatih Arslan关于控制理论和反馈循环的文章,这些理论用于构建能够自我修复、弹性伸缩、可扩展数千个数据库的系统。
一位求职者发现,小型初创公司采用 Kubernetes 并非出于技术可扩展性,而是为了组织层面的好处,如一致性、共享知识和可追溯性。这篇文章反思了 Kubernetes 对小型团队的非技术优势。
Claw Patrol 是一款面向AI Agent的安全防火墙,位于Agent与生产环境之间,通过HCL规则解析流量并管控行为,可拦截破坏性SQL操作,或对kubectl delete pod等风险命令要求人工审批。
Kelsey Hightower 分享了他如何运用同理心工程会议——让资深工程师在手动安装 Kubernetes 过程中体验困难——来建立信任并推动云工具改进。
nixidy 是一个基于 Nix 的工具,用于管理 Kubernetes GitOps 部署,它用类型化、可复现的 Nix 表达式替代了 Helm 值文件和 Kustomize 覆盖层。本教程将介绍如何使用 Argo CD 设置 nixidy 项目,并生成纯 YAML 以供审查。
DanKornas 介绍了一个开源的 AI 基础设施工程师学习路径,这是一个结构化的 10 模块课程,涵盖从基础到 LLM 基础设施的内容,包含实践实验和项目。
Gergely Orosz讲述了Kelsey Hightower从DSL技术员成长为Google和Microsoft杰出工程师的励志历程,分享了关于副业、不用AI解释创业公司以及薪酬谈判的关键经验。
中国发布了OpenSandbox,这是一个面向AI智能体的开源沙箱运行时,支持多种SDK以及通过Docker/Kubernetes隔离的安全执行环境。
Expanse 是一家创业公司,通过预测作业资源需求并提供优化建议,提高GPU/HPC集群的利用率,解决常见的过度请求资源导致实际利用率仅为30-40%的问题。
一篇博客文章,解释如何将 SOPS 与 Age 结合用于在集群外加密 Secrets,并使用 Bitnami Sealed Secrets 在集群内解密,从而实现 Kubernetes 的 GitOps 工作流。
burn是一个零配置、人工智能驱动的CLI工具,可分析涵盖计算、存储、负载均衡器和GPU的Kubernetes集群成本,支持现货实例就绪性、Prometheus集成和Slack原生查询。
一项基准研究发现,经过校准的基于规则的自动扩缩器在所有测试工作负载上成本均优于六种主流深度强化学习算法,而深度强化学习仅在突发流量模式中表现出更高成本下的优势。该论文提出了RLScale-Bench以改进评估协议和可复现性。
一个全面的500小时学习路径,涵盖AI基础设施工程,包括Docker、Kubernetes、MLOps、LLM基础设施等,通过动手项目和实验进行学习。
Agyn是一个开源的、原生于Kubernetes的代理运行时,它将Claude Code和Codex等AI代理引入生产环境,具备完整的凭证隔离和预构建的适配器。它通过在Sidecar中运行MCP服务器并对内部服务使用mTLS来解决安全问题,防止提示注入导致凭证泄露。
本文解释为何平均CPU利用率对于延迟敏感型工作负载是一个误导性指标,利用排队论和一个真实的生产事故案例,主张采用更细致的监控方法。
Google 开源了 AX (Agent eXecutor),这是一个面向 Kubernetes 设计的分布式运行时框架,用于编排代理循环,并内置了故障恢复和任务继续执行能力。
一份全面指南,介绍在生产环境中调试和管理 Amazon EKS 集群,重点关注常见故障模式、事件响应和安全升级。涵盖 EKS 与标准 Kubernetes 的关键差异。