标签
Gergely Orosz报告了Spotify播客发布在一个月内第三次重大故障,质疑是否归咎于AI部署,并指出没有状态页面。
Anthropic 报告并解决了影响多个 Claude 模型和服务的错误率升高问题,该问题发生于 2026 年 6 月 23 日,持续时间为 UTC 时间 14:08 至 15:33。
一条推文批评了 Coinbase 对其 2026 年 5 月 7 日宕机事件的事后复盘,指出一个市值 400 亿美元的公司应该具备自动故障转移等基本弹性能力。
Coinbase 10小时宕机的事后分析报告显示,他们因延迟原因在全球交易中仅运行单一区域,且无自动故障转移机制,引发对其基础设施可靠性的担忧。
GitHub 经历了短暂故障,影响了未认证用户的 Issues、Pull Requests 和 Actions。该事件已解决,监控仍在进行中。
Notion 在短暂的服务中断导致性能下降后,恢复了对 Anthropic Claude 模型的访问。两家公司均确认该问题是暂时性的且已解决。
GitHub 遇到一个授权问题,意外删除了聊天集成中的 Slack 和 Teams 频道订阅。该问题已得到缓解,受影响的用户可以手动重新订阅。
Shopify 于 2026 年 6 月 3 日发生部分宕机,影响管理员访问、商店前台、结账和零售 POS 系统。问题已确认并缓解;目前正在监控中。
2026年5月12日,GitHub Actions 因内部数据库迁移导致复制延迟,影响了 CodeQL、webhooks 和通知。服务在扩展工作节点后恢复。
2026 年 5 月 26 日,GitHub 发生性能降级和身份验证问题,影响了 Actions 和 Pages。该事件正在调查和缓解中。
Hacker News 上的一场讨论质疑 Google 是否应该就 Railway 事件发表公开声明,该事件中 GCP 账户被暂停导致了一起备受关注的宕机。
Railway 遭遇严重宕机,起因是 Google Cloud 封禁了其账户,导致仪表盘和服务受影响;团队正在与 Google 协作以恢复访问。
Gergely Orosz 批评苹果缺乏公开的服务状态页面,指出用户受近期服务中断影响却未收到官方通知。
Coinbase CEO 裁员并声称非技术团队已用AI编写生产性代码,但不到24小时后,Coinbase交易引擎及状态页面相继宕机,引发外界对过度依赖AI替代技术人员的质疑。
Let's Encrypt 因潜在事件正在停止证书发放,同时进行计划的数据库维护,可能导致 ACME 客户端超时最长 10 分钟。
AWS位于弗吉尼亚北部的US-East-1区域发生数据中心宕机事件,原因是过热,影响了FanDuel和Coinbase交易平台,预计恢复需要数小时。