modal

标签

Cards List
#modal

@charles_irl: 推测就是一切

X AI KOLs Following · 3小时前 缓存

Yong Quan 强调,更好的推测解码器可以在 LLM 推理中实现近乎线性的吞吐量提升,该观点由 Charles 在 Modal 研讨会上提出。

0 人收藏 0 人点赞
#modal

@anthonycorletti:最好的开发者平台在计算、存储和网络之上创建抽象层,让即使是最复杂的工作负载也能无…

X AI KOLs Following · 5天前 缓存

Modal 宣布推出 Auto Endpoints,实现轻松推理,开发者 Anthony Corletti 称赞其为计算、存储和网络之上的一流抽象。

0 人收藏 0 人点赞
#modal

Modal Auto Endpoints:你掌控的优化推理

Hacker News Top · 6天前 缓存

Modal推出了Auto Endpoints,这是一项自助服务,提供优化的、生产级的LLM推理,具备完整代码所有权、透明指标和自动缩放功能,构建于其无服务器GPU基础设施之上。

0 人收藏 0 人点赞
#modal

@bernhardsson: 现在所有用户都可以在@modal上使用托管的私有LLM端点。只需在UI上点击几下或在CLI中敲击几下键盘即可部署。

X AI KOLs Timeline · 6天前 缓存

Modal宣布向所有用户开放托管的私有LLM端点,支持通过UI或CLI轻松部署,并且客户可以完全访问底层代码。

0 人收藏 0 人点赞
#modal

@charles_irl: 几年前,人工智能的未来看起来一片黯淡——专有模型、专有推理服务……

X AI KOLs Following · 6天前 缓存

Modal 宣布推出 Auto Endpoints,这是一项可通过一键实现优化的开源 AI 推理的服务,旨在对抗专有模型和服务的趋势。

0 人收藏 0 人点赞
#modal

@modal:现在真正拥有你的推理还为时不晚。介绍:Modal Auto Endpoints。

X AI KOLs Timeline · 6天前 缓存

Modal 宣布推出 Auto Endpoints,这是一个用于拥有和部署 AI 推理的新功能。

0 人收藏 0 人点赞
#modal

@charles_irl: GLM 5.2 runs pretty fast on Modal.

X AI KOLs Following · 6天前 缓存

GLM 5.2 在 Modal 云平台上展现出快速的性能表现。

0 人收藏 0 人点赞
#modal

@charles_irl: 你在吗?

X AI KOLs Following · 2026-06-22 缓存

Modal 讨论了管理沙箱系统整个生命周期的重要性,而不仅仅是初始启动,并强调了诸如 .wait_until_ready() 之类的工具。

0 人收藏 0 人点赞
#modal

@modal: .wait_until_ready(), set, go 构建高性能沙箱系统远不止于初始容器启动。我们正在解释...

X AI KOLs Following · 2026-06-22 缓存

Modal 解释了构建高性能沙箱系统的复杂性,超越了初始容器启动,并分享了生命周期管理工具。

0 人收藏 0 人点赞
#modal

@charles_irl: 这个块量化可视化工具是我们 LLM Engineer's Almanac 中的另一页——为寻求...的工程师提供一站式服务

X AI KOLs Following · 2026-06-22 缓存

LLM Engineer's Almanac 中的新页面提供了一个块量化可视化工具,帮助工程师理解量化格式,以便掌握自己的 LLM 推理。

0 人收藏 0 人点赞
#modal

@charles_irl: 周五,我们发布了六个用于加速推理的最新先进草稿模型。我们还发布了一篇关于为何……的博文

X AI KOLs Following · 2026-06-22 缓存

周五,我们发布了六个用于加速推理的最新先进草稿模型,同时发布了一篇关于推测解码的博文,以及一个用于估算加速比的山脊线模型工具。

0 人收藏 0 人点赞
#modal

@modal:沙盒启动延迟和扩展能力决定强化学习训练运行的成败。这篇好文对此进行了深入剖析,使用…展示

X AI KOLs Following · 2026-06-16 缓存

讨论了强化学习训练基础设施中沙盒启动延迟和扩展能力如何显著影响训练性能,引用了SemiAnalysis对匹配训练器和生成器吞吐量的详细分析。

0 人收藏 0 人点赞
#modal

@zhijianliu_: 这正是 DFlash 的用武之地。我们的块扩散起草器 + KV注入,现在正在前沿规模上运行——感谢…

X AI KOLs Following · 2026-06-15 缓存

DFlash,一个带有KV注入的块扩散起草器,现在正在前沿规模上运行,相比基线实现了高达4.3倍的吞吐量提升,集成了Modal和SGLang以用于Qwen 397B。

0 人收藏 0 人点赞
#modal

我在68,000件艺术品上部署了多模态语义搜索。Modal + L40S + Qwen3-VL-Embedding

Reddit r/AI_Agents · 2026-06-03

一位开发者使用Qwen3-VL-Embedding、FAISS、Modal和Cloudflare R2,在国家美术馆的68,000件艺术品上构建了多模态语义搜索系统。该系统热响应时间约1.3秒,冷启动约44秒,同时支持文本到图像和图像到图像的查询。

0 人收藏 0 人点赞
#modal

@THayes427: 另外请查看这个@modal教程,它详细讲解了上面笔记本中的底层代码,并提供了更多详细解释…

X AI KOLs Following · 2026-06-02 缓存

一个Modal教程,展示如何使用ESMFold2和ESMC模型扩展蛋白质绑定剂设计,包含用于迭代优化和自动伸缩基础设施的代码。

0 人收藏 0 人点赞
#modal

@slime_framework: Modal 说得清楚:前沿强化学习不再只是算法问题——而是一个基础设施问题。很高兴看到 sl…

X AI KOLs Following · 2026-06-01 缓存

一条推文强调,前沿强化学习现在是一个基础设施问题,提到了开源 slime 库在 Modal 强化学习栈中的使用以及上游贡献。

0 人收藏 0 人点赞
#modal

@_djdumpling:非常令人兴奋的工作,很高兴今年夏天能在 @modal 从事强化学习工作!

X AI KOLs Timeline · 2026-06-01 缓存

用户对在 Modal 从事强化学习工作表示兴奋,并提及 Modal 发布了开源库以及在扩展强化学习训练中学到的经验。

0 人收藏 0 人点赞
#modal

@charles_irl: 恰当的后训练强化学习,广泛部署,是迈向未来软件系统能悄然自我改进、适应人类需求的关键一步。

X AI KOLs Following · 2026-06-01 缓存

Modal 在其平台上宣布了一个开源的强化学习库,通过可扩展的部署解决后训练强化学习中的基础设施挑战。

0 人收藏 0 人点赞
#modal

@charles_irl: 来自你的友好本地疯子 (r/localllama) 的更多氛围检查 https://reddit.com/r/LocalLLaMA/s/vqBVXvIT…

X AI KOLs Following · 2026-05-29 缓存

Modal 宣布对 Step 3.7 Flash 提供 Day 0 支持,该模型是一个 198B 参数的 MoE 模型,拥有 256K 上下文窗口和原生图像/视频理解能力。

0 人收藏 0 人点赞
#modal

@modal: Modal上Step 3.7 Flash的Day 0支持 - 198B参数的MoE,11B激活参数 - 256K上下文 - 3个推理层级 - N…

X AI KOLs Following · 2026-05-29 缓存

Modal宣布为Step 3.7 Flash AI模型提供Day 0支持,该模型拥有198B参数的MoE(11B激活参数)、256K上下文、三个推理层级,以及原生图像和视频理解能力。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈