标签
Cerebrium 通过检查点 CPU 和 GPU 内存,减少 AI 工作负载的 GPU 冷启动,在数秒内恢复完全初始化的容器,将启动时间缩短超过 80%。
FlareMo是一个基于Cloudflare Workers的个人笔记系统,利用免费套餐实现零服务器运维,支持Flomo风格的时间线笔记、标签、附件、搜索等功能。
Vercel 现在支持运行任意 Dockerfile,允许开发者直接在 Vercel 的 Fluid 计算平台上部署容器化的 HTTP 服务(Go、Rails、Spring Boot 等),具备自动扩展、预览部署和按 CPU 使用付费的功能。
Vercel 宣布推出 Services,允许用户在一个项目中使用原子部署、回滚、预览 URL 和内部网络并置多个后端和前端服务。
Fireworks AI 宣布推出 Serverless 2.0,引入三个服务层级(标准、优先、快速),无需预先配置 GPU 即可处理流量拥塞,通过按请求路由实现可靠性和成本效益。
Modal 宣布推出由 Modal Servers 驱动的新 Auto Endpoints 功能,详细介绍了使用 EnvoyProxy、Google Cloud Spanner 和 Cloudflare Pingora 的架构。
Modal 宣布推出 Auto Endpoints,实现轻松推理,开发者 Anthony Corletti 称赞其为计算、存储和网络之上的一流抽象。
Modal推出了Auto Endpoints,这是一项自助服务,提供优化的、生产级的LLM推理,具备完整代码所有权、透明指标和自动缩放功能,构建于其无服务器GPU基础设施之上。
Modal 宣布推出 Auto Endpoints,这是一个用于拥有和部署 AI 推理的新功能。
AWS Lambda 宣布推出 MicroVMs,这是一种新的无服务器计算原语,提供隔离、有状态的执行环境,具备虚拟机级别的隔离和近乎瞬时的启动,由 Firecracker 驱动。
本教程介绍如何利用Cloudflare的免费Serverless服务(包括Pages、KV)零成本搭建高速私人VLESS节点,实现流畅观看4K/8K视频和访问AI服务。
这个Cloudflare实战手册专为AI编程时代设计,整理了Cloudflare各模块的使用方法、常见坑和AI编程工作流,适合用来当AI写Cloudflare项目的说明书。
realchendahuang 发布了一个 Cloudflare 实战手册(Playbook),面向使用 AI 编程的独立开发者,涵盖 Workers、Pages、D1、R2、KV 等服务的选择、用法、免费额度、付费方案、AI 编程常见坑以及开源项目参考。
Cloudflare推出了临时账户,允许AI代理无需注册即可部署代码,通过Wrangler中的新--temporary标志实现短暂、可认领的部署。
Modal 宣布了多项重大产品更新,包括支持真实 Linux 内核的 VM 沙箱、更低延迟的区域路由、沙箱的域名允许列表、基于角色的访问控制(RBAC)、命名镜像以及 SDK 更新。
本推文介绍了Cloudflare提供的多种开发功能,包括对象存储R2、后端API Worker、AI网关AI Gateway、容器、缓存KV、数据库D1和PostgreSQL连接HyperDrive等,强调其价格便宜、功能丰富且免费额度充足。
提出一种去中心化的信息发现系统,使用设备端嵌入模型和点对点传播,消除了对搜索引擎等中心索引的需求。
提出SSD-FL,一种无服务器半去中心化联邦学习方法,通过有效损失函数和基于Cheeger不等式的迭代聚类优化异构环境中的聚类形成,提升了收敛速度和通信效率。
Cloudflare 发布了 Flagship,这是一项功能标记服务,允许开发者在不重新部署的情况下控制功能可见性,支持原生 Workers 绑定和 OpenFeature 兼容性。