@VikParuchuri:本周我们将处理约 10 亿页内容。@datalabto 团队在跨数千个 GPU 编排我们的模型方面做出了令人惊叹的工作……
摘要
DataLab 团队本周正在数千个 GPU 上编排 AI 模型,以处理约 10 亿页内容,彰显了显著的大规模文档处理能力。
本周我们将处理约 10 亿页内容。
@datalabto 团队在跨数千个 GPU 编排我们的模型方面做出了令人惊叹的工作。
查看缓存全文
缓存时间: 2026/05/11 18:50
本周我们将处理约10亿个页面。
@datalabto 团队在跨数千个GPU编排我们的模型方面做了出色的工作。
相似文章
@victormustar: 在本周结束之前,让我们回顾一下开放AI领域最疯狂的一周,发布了超过25个引人注目的开放权重模型…
本周开放AI领域异常精彩,发布了超过25个开放权重模型,涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域,NVIDIA、Google等机构贡献突出。
@bastani_behnam:我们刚刚发布了如何在 27B 模型上解锁 +50% 推理容量——无需新 GPU、无需新节点,成本仅为一小部分……
OpenInfer 展示“垂直拆解”,通过单节点 AMD EPYC CPU 与 Nvidia L40S GPU 协同执行量化层,并配合自定义 SLA 感知调度器,将 Qwen 3.5 27B 的吞吐量提升约 50%。
我们的 TPU 如何驱动日益复杂的 AI 工作负载。
Google 介绍了其定制张量处理单元 (TPU) 如何设计以处理庞大的 AI 工作负载,并强调了最新一代 TPU 具备处理 121 exaflops 计算能力的特点。
OpenAI 全新 GPT-5.5 赋能 Codex 运行于 NVIDIA 基础设施 — NVIDIA 已率先投入实际应用
OpenAI 的最新前沿模型 GPT-5.5 现已为 Codex 提供动力,并在 NVIDIA GB200 NVL72 系统上运行。NVIDIA 员工已投入使用,并在生产力和调试速度方面取得了可衡量的提升。
@dhruvtwt_:怎么没人聊这事?@nvidia 正免费提供约 80 款 AI 模型的托管 API
Nvidia 低调开放约 80 款免费托管 AI 模型 API,包括 MiniMax M2.7、GLM 5.1、Kimi 2.5、DeepSeek 3.2、GPT-OSS-120B 等,可直接接入 OpenClaude、Zed IDE 等主流开发工具。