标签
这篇研究博客文章表明,反复将 LLM agent 的经历改写成文本形式的“教训”往往会降低性能,而非提升性能。作者发现,在 ARC-AGI 和 ALFWorld 等基准测试中,情景记忆保留的效果优于抽象巩固。
Cloudflare与OpenAI合作,使OpenAI的前沿模型(包括GPT-5.4)可直接在Cloudflare Agent Cloud中访问,从而使企业能够大规模部署AI代理以执行实际任务。该集成还包括Codex工具,这些工具现已在Cloudflare Sandboxes中全面可用,并即将在Workers AI中提供。
OpenAI 发布了 GPT-5.4 mini 和 nano,它们是 GPT-5.4 的更小、更快的变体,专为高吞吐量工作负载设计,在编码、推理和多模态理解方面有显著改进,同时保持 2 倍以上的速度提升。