ray

标签

Cards List
#ray

@robertnishihara:试试Ray 2.56!

X AI KOLs Following · 3天前 缓存

Ray 2.56已发布,包含Ray Data的稳定性改进以及Ray Serve的重构,以提升LLM服务的性能。

0 人收藏 0 人点赞
#ray

@raydistributed: 我们刚刚发布了 Ray 2.56!这包括 - Ray Data 稳定性改进:减少对象存储溢出,自动 ba…

X AI KOLs Following · 3天前

Ray 2.56 已发布,改进了 Ray Data、面向 LLM 的 Ray Serve、GPU 域感知放置组以及 Kubernetes 集成。

0 人收藏 0 人点赞
#ray

@robertnishihara: 一个关于RL中解耦重要性的绝佳案例。来自论文:LLM生成在预填充和解码之间交替…

X AI KOLs Following · 2026-06-20 缓存

Robert Nishihara 强调了一篇关于解耦RL工作负载的论文,表明使用计算优化的H800进行预填充,带宽优化的H20进行解码,可以分别将rollout时间减少21-51%和47%,强调没有单一硬件类型适合所有阶段。

0 人收藏 0 人点赞
#ray

@seiji_________: 今天,我们激动地宣布,与 Google Cloud 的 GKE 团队(@googlecloud)合作,一项重大里程碑……

X AI KOLs Following · 2026-06-18 缓存

Ray Serve LLM 在 Ray 2.56 中,对预填充密集型工作负载实现了高达 4 倍的吞吐量提升,对解码密集型工作负载实现了 24 倍的提升,在生产基准测试中与基于 Rust 的路由框架(如 vllm-router)性能相当,这是与 Google Cloud GKE 团队合作宣布的。

0 人收藏 0 人点赞
#ray

@robertnishihara: 关于PD分离的一些直觉——PD不会加速预填充,实际上可能损害TTFT——PD的真正…

X AI KOLs Following · 2026-06-17 缓存

这篇来自Anyscale的博客文章解释了LLM服务中Prefill-Decode(PD)分离的直觉,展示了如何将预填充和解码阶段分配到专用GPU上,在使用Ray和vLLM的AMD MI325X上实现高达2.7倍的有效吞吐量提升和67%的成本节省,同时也讨论了PD分离何时没有帮助。

0 人收藏 0 人点赞
#ray

@anyscalecompute: Anyscale on Azure 现已公开预览,我们将深入探讨其工作原理。与 Daniel Arrizza(现场工程师)…

X AI KOLs Following · 2026-06-09 缓存

Anyscale on Azure 现已公开预览。Daniel Arrizza 和 Paul Yu 将主持一场工作研讨会,探讨如何在 Azure 租户内构建和部署生产级 AI 工作负载,并与现有 Azure 服务集成。

0 人收藏 0 人点赞
#ray

@raydistributed: 祝贺微软 AI 团队推出 MAI-Thinking-1!很高兴看到 Ray 在前沿模式的多个部分中被使用…

X AI KOLs Following · 2026-06-04 缓存

微软 AI 发布了 MAI-Thinking-1,一个拥有 350 亿活跃参数/1 万亿总参数的 MoE 推理模型,在 STEM 和编码任务上具有竞争力,使用 Ray 进行分布式训练和编排。

0 人收藏 0 人点赞
#ray

@raydistributed: 在Snowflake上试用基于Ray的批量推理

X AI KOLs Following · 2026-05-21 缓存

Snowflake现在支持基于Ray的作业级批量推理,通过单一API调用即可在数百万非结构化数据点上执行分布式GPU,从而扩展模型推理。

0 人收藏 0 人点赞
#ray

@anyscalecompute:在本节课中,您将学到:- 使用Ray构建和扩展数据管道 - 什么是视频数据筛选 - 大规模流式传输…

X AI KOLs Following · 2026-05-07 缓存

Anyscale正在举办一场动手虚拟实验室课程,教授开发者如何使用Ray构建和扩展数据管道,涵盖视频数据筛选、分布式GPU推理以及CPU/GPU流式管道。

0 人收藏 0 人点赞
#ray

@anyscalecompute:大多数编码 Agent 都会写 Python,但这不代表它们会部署 Ray 工作负载

X AI KOLs Following · 2026-04-22 缓存

Anyscale 推出 Agent Skills,帮助编码 Agent 正确部署 Ray 工作负载,妥善处理 GPU 内存并使用最新 API。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈