API 中的提示词缓存
摘要
OpenAI 推出提示词缓存功能,这是一项自动特性,通过在 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini 模型上重用最近缓存的输入令牌,可将 API 成本降低 50% 并改善延迟。该功能会自动应用于超过 1,024 个令牌的提示词,无需开发者进行集成更改。
查看缓存全文
缓存时间: 2026/04/20 14:50
相似文章
提示缓存,但用于 RL 训练——在长提示/短回复负载上实现 7.5 倍加速
一种面向开源 RL 训练引擎的全新优化技术在训练过程中引入了提示缓存,通过减少冗余计算,在长提示、短回复负载场景下实现了高达 7.5 倍的加速。
在 API 中推出 GPT-4.1
OpenAI 通过 API 推出 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 模型,在编程(SWE-bench 得分达 54.6%)、指令遵循和 100 万 token 上下文窗口方面有重大改进,成本更低。GPT-4.5 Preview 将于 2025 年 7 月 14 日停用。
面向开发者推出GPT-5.1
OpenAI发布了GPT-5.1,这是GPT-5系列中的一个新模型,它可以基于任务复杂度动态调整思考时间,在保持前沿智能的同时,性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存(24小时保留)、新的编码工具(apply_patch和shell),以及针对延迟敏感应用的“无推理”模式。
我如何在长时间智能体运行中轻松减少约90%的输入token消耗
作者分享了一个实用技巧,通过提示缓存(prompt caching)在长时间智能体运行中将输入token成本降低约90%:将不变文本(系统提示、工具定义、上下文)放在每个提示的开头,以利用LLM提供商的缓存前缀。
提示词基础
OpenAI Academy 关于提示词基础的指南,教导用户如何编写清晰、有效的提示词,通过诸如明确具体、添加背景、指定输出格式以及分解复杂任务等技巧,从 ChatGPT 获得更好的回复。