标签
谷歌正在采用英伟达的策略来打造有竞争力的AI芯片业务,向Anthropic出租TPU计算能力,并提升推理性能以与英伟达的主导地位竞争。
LMSYS Org 的一篇博客文章详细介绍了使用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T(一个 1 万亿参数的混合 MoE 模型),通过单个 Pallas 内核将 MoE 数据移动隐藏在计算之后,从而实现高效的推理。
谷歌正与三星洽谈,计划使用2纳米技术为其下一代AI芯片(代号Icefish)制造部分组件,而主要部分将由台积电生产。该芯片旨在成为英伟达GPU的替代品,预计最早于2028年进入量产。
一款适用于 Google Colab 的全新 CLI 工具,支持从终端进行 GPU/TPU 配置、远程脚本执行和交互式 REPL 访问,内置 Agent Skills 功能,可自动完成模型微调等任务。
本文是AI工程全景系列的上篇,从历史角度梳理了GPU从游戏显卡到AI加速器的演化、CUDA的豪赌、谷歌TPU的独立路径,以及英伟达为何最终胜出,详细剖析了芯片、供应链、网络、电力等AI基础设施的底层逻辑。
Midjourney表示,使用Google TPU使他们的研究落后了一年,并对没有完全坚持使用Nvidia硬件表示遗憾。
谷歌展示了Gemini Flash模型在TPU 8i上实现每秒600-1400 token的处理速度,与Groq的推理速度相当。
Google 发布了 2026 年 4 月的主要 AI 更新汇总,包括 Gemma 4 模型、Gemini 企业智能体平台以及在 Cloud Next '26 上宣布的第八代 TPU。
Google 介绍了其定制张量处理单元 (TPU) 如何设计以处理庞大的 AI 工作负载,并强调了最新一代 TPU 具备处理 121 exaflops 计算能力的特点。
谷歌在 Cloud Next 大会上发布第八代 TPU(8t/8i)与全新 Gemini Enterprise Agent Platform,并透露目前 75% 的新代码由 AI 生成。
Google 发布第八代 TPU 8t 与 TPU 8i,专为大规模预训练与推理设计,集成 SparseCore、原生 FP4,并支持 9,600 芯片级超节点,为世界模型与智能体 AI 提供算力。
Google发布第八代TPU:TPU 8t用于训练,TPU 8i用于推理,专为大规模、高能效AI智能体工作负载打造,将于今年晚些时候推出。
谷歌宣布推出两款新型专用 TPU 芯片:TPU 8i 和 TPU 8t,分别旨在优化 AI 智能体的推理能力以及大模型的训练效率。
Sundar Pichai opened Google I/O 2026 with highlights of AI token processing reaching 3.2 quintillion per month, new TPU 80/80i chips, the Gemini Omni world model, and multiple product updates, emphasizing full-stack AI innovation.
Google I/O '26 主题演讲展示了AI全面提速:月处理3.2千万亿Token,Gemini月活超9亿,发布新一代TPU芯片及世界模型Gemini Omni,并推出Ask YouTube、Docs Live等对话式AI功能。
这是一个关于TPU训练日备战Google I/O的创意幽默短片,通过对话和激励口号展现TPU团队迎接数万亿任务挑战的精神。