通过 Gemini API 中的 Webhook 减少长时间运行任务的摩擦和延迟
摘要
Google 为 Gemini API 推出了事件驱动的 Webhook,以减少 Deep Research 和批处理等长时间运行任务的延迟和摩擦。该功能用基于推送的通知取代了低效的轮询,从而提升了代理式应用程序的开发者体验。
<img src="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WebhooksGeminiAPI-hero.max-600x600.format-webp.webp">事件驱动的 Webhook 是一种基于推送的通知系统,消除了对低效轮询的需求。
查看缓存全文
缓存时间:
2026/05/08 07:42
# 利用 Gemini API 中的 Webhooks 降低长时间运行任务的摩擦与延迟
来源:https://blog.google/innovation-and-ai/technology/developers-tools/event-driven-webhooks/
我们正在让构建复杂、长时间运行的智能体(Agent)应用程序变得更加简便和高效,这得益于 Gemini API Webhooks 的支持。
Hussein Hassan Harrirou
工程团队,Gemini API
Gemini API
您的浏览器不支持音频元素。
收听文章
本内容生成自 Google AI。生成式 AI 属于实验性功能。
[[duration]] 分钟
今天,我们宣布让构建复杂、长时间运行的智能体应用变得更加简便和高效。我们引入了基于事件的 Webhooks——一种基于推送的通知系统,从而消除了低效轮询的需求。
随着 Gemini 转向智能体工作流和高吞吐量处理——例如深度研究(Deep Research)、长视频生成或通过批量 API(Batch API)处理数千个提示——操作可能需要几分钟甚至几小时。在此之前,开发者必须依赖持续轮询(例如,重复调用 `GET` 操作)来检查任务是否完成。
现在,一旦任务完成,Gemini API 即可实时向您的服务器推送 HTTP POST 有效负载。
我们在设计时充分考虑了可靠性与安全性。我们的实现严格遵循 [标准 Webhooks](https://github.com/standard-webhooks/standard-webhooks) 规范。每个请求均使用 `webhook-signature`、`webhook-id` 和 `webhook-timestamp` 标头进行签名,以确保幂等性并防止重放攻击。我们还通过长达 24 小时的自动重试机制,保证“至少一次”交付。
## 工作原理
您可以在项目级别全局配置 Webhooks(通过 HMAC 保护),也可以针对每个请求动态覆盖它们,以路由特定任务(通过 JWKS 保护)。
以下是一个使用 Python SDK 为批量任务动态配置 Webhook 的快速示例:
## 即刻开始
此功能现已面向所有使用 Gemini API 的开发者开放:
- **阅读指南:** 查看 [Webhooks 文档](https://ai.google.dev/gemini-api/docs/webhooks),探索完整的事件目录,并了解如何保护您的端点。
- **动手实践:** 我们准备了一份全面的 [Cookbook](https://github.com/google-gemini/cookbook/blob/main/quickstarts/Webhooks.ipynb),帮助您构建端到端的 Webhook 集成。
相似文章
Google AI Blog
Google 为 Gemini API 推出了 Flex 和 Priority 推理层,为开发者提供了对同步请求成本与可靠性的精细控制。Flex 可为对延迟不敏感的任务节省 50% 的成本,而 Priority 则可确保关键应用的高可靠性。
X AI KOLs Following
Google 正在更新 Gemini Interactions API,用灵活的基于步骤的系统(outputs + roles → steps)取代严格的 user/model 角色,引入类似 user_input、thought、function_call、tool_call 和 model_output 的代理步骤。该更新还合并了 response_format 控制,并要求升级 SDK(Python/JS ≥2.0.0)或添加新的 API 标头以选择加入。
Reddit r/singularity
Google Cloud 发布 Gemini Enterprise Agent Platform,这是一项托管服务,用于在企业级规模上构建和部署 AI 代理。
Google DeepMind Blog
Google发布了Gemini 2.5 Pro Preview(I/O版本)的早期访问权限,具备显著改进的编码能力,可用于构建交互式Web应用。该模型现已领先WebDev Arena排行榜,Elo评分提升了147分。
Google DeepMind Blog
Google DeepMind 宣布为 Gemini 推出高级安全改进措施,通过模型加固、自适应评估和分层防御机制来防御间接提示注入攻击。该方法结合了对抗场景的微调和系统级防护栏,在保持模型性能的同时构建了内在的抗御能力。