通过 Gemini API 中的 Webhook 减少长时间运行任务的摩擦和延迟

Google AI Blog 工具

摘要

Google 为 Gemini API 推出了事件驱动的 Webhook,以减少 Deep Research 和批处理等长时间运行任务的延迟和摩擦。该功能用基于推送的通知取代了低效的轮询,从而提升了代理式应用程序的开发者体验。

<img src="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/WebhooksGeminiAPI-hero.max-600x600.format-webp.webp">事件驱动的 Webhook 是一种基于推送的通知系统,消除了对低效轮询的需求。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/08 07:42

# 利用 Gemini API 中的 Webhooks 降低长时间运行任务的摩擦与延迟 来源:https://blog.google/innovation-and-ai/technology/developers-tools/event-driven-webhooks/ 我们正在让构建复杂、长时间运行的智能体(Agent)应用程序变得更加简便和高效,这得益于 Gemini API Webhooks 的支持。 Hussein Hassan Harrirou 工程团队,Gemini API Gemini API 您的浏览器不支持音频元素。 收听文章 本内容生成自 Google AI。生成式 AI 属于实验性功能。 [[duration]] 分钟 今天,我们宣布让构建复杂、长时间运行的智能体应用变得更加简便和高效。我们引入了基于事件的 Webhooks——一种基于推送的通知系统,从而消除了低效轮询的需求。 随着 Gemini 转向智能体工作流和高吞吐量处理——例如深度研究(Deep Research)、长视频生成或通过批量 API(Batch API)处理数千个提示——操作可能需要几分钟甚至几小时。在此之前,开发者必须依赖持续轮询(例如,重复调用 `GET` 操作)来检查任务是否完成。 现在,一旦任务完成,Gemini API 即可实时向您的服务器推送 HTTP POST 有效负载。 我们在设计时充分考虑了可靠性与安全性。我们的实现严格遵循 [标准 Webhooks](https://github.com/standard-webhooks/standard-webhooks) 规范。每个请求均使用 `webhook-signature`、`webhook-id` 和 `webhook-timestamp` 标头进行签名,以确保幂等性并防止重放攻击。我们还通过长达 24 小时的自动重试机制,保证“至少一次”交付。 ## 工作原理 您可以在项目级别全局配置 Webhooks(通过 HMAC 保护),也可以针对每个请求动态覆盖它们,以路由特定任务(通过 JWKS 保护)。 以下是一个使用 Python SDK 为批量任务动态配置 Webhook 的快速示例: ## 即刻开始 此功能现已面向所有使用 Gemini API 的开发者开放: - **阅读指南:** 查看 [Webhooks 文档](https://ai.google.dev/gemini-api/docs/webhooks),探索完整的事件目录,并了解如何保护您的端点。 - **动手实践:** 我们准备了一份全面的 [Cookbook](https://github.com/google-gemini/cookbook/blob/main/quickstarts/Webhooks.ipynb),帮助您构建端到端的 Webhook 集成。

相似文章

Gemini API 中平衡成本与可靠性的新途径

Google AI Blog

Google 为 Gemini API 推出了 Flex 和 Priority 推理层,为开发者提供了对同步请求成本与可靠性的精细控制。Flex 可为对延迟不敏感的任务节省 50% 的成本,而 Priority 则可确保关键应用的高可靠性。

@_philschmid: Gemini Interactions API 更新 随着我们超越简单提示,严格的“user”和“model”角色显得局限。因此……

X AI KOLs Following

Google 正在更新 Gemini Interactions API,用灵活的基于步骤的系统(outputs + roles → steps)取代严格的 user/model 角色,引入类似 user_input、thought、function_call、tool_call 和 model_output 的代理步骤。该更新还合并了 response_format 控制,并要求升级 SDK(Python/JS ≥2.0.0)或添加新的 API 标头以选择加入。

增强 Gemini 的安全保护

Google DeepMind Blog

Google DeepMind 宣布为 Gemini 推出高级安全改进措施,通过模型加固、自适应评估和分层防御机制来防御间接提示注入攻击。该方法结合了对抗场景的微调和系统级防护栏,在保持模型性能的同时构建了内在的抗御能力。