标签
# GPT-5.3-Codex-Spark 发布 来源:[https://openai.com/index/introducing-gpt-5-3-codex-spark/](https://openai.com/index/introducing-gpt-5-3-codex-spark/) 今天,我们发布了 GPT‑5\.3‑Codex‑Spark 的研究预览版。这是 GPT‑5\.3‑Codex 的一个更小版本,也是我们首个专为实时编码设计的模型。Codex‑Spark 标志着我们与 Cerebras 合作关系[于 1 月宣布](https://openai.com/index/cerebras-partnership/)的第一个里程碑。Codex‑Spark 针对实时编码进行了优化。
DeepMind 推出 D4RT,一个统一的 AI 模型,用于动态 4D 场景重建与追踪,效率较此前方法提升高达 300 倍。该模型采用基于查询的 Transformer 架构,为机器人技术与 AR 应用解决复杂的空间和时序任务。
Google 发布了 Gemini 3 Pro,这是一款全新的 AI 模型,旨在编程、智能体工作流和多模态推理方面超越之前的版本。该模型可通过 Gemini API、Google AI Studio 以及全新的 Google Antigravity 开发平台使用。
Google 发布 Gemini 2.5 Pro 预览版(I/O 版本),编码能力显著提升,在 WebDev Arena 前端开发排行榜上排名第一,并支持视频转代码等高级功能。
Google 宣布推出 Gemini 2.5 Flash,这是一个新的混合推理模型,现已通过 Gemini API 以预览版形式提供。该模型具有可切换的思考能力、细粒度的思考预算以平衡质量、成本和延迟,并在保持快速推理速度的同时相比 2.0 Flash 提升了性能。
Google 开发了 DolphinGemma,一个大语言模型,旨在学习和生成海豚的鸣叫声。该项目与乔治亚理工学院和 Wild Dolphin Project 合作,旨在推进对海豚沟通模式的理解,并实现潜在的物种间对话。
Google推出了Gemini 2.5,这是其最智能的AI模型。Gemini 2.5 Pro Experimental在LMArena基准测试中领先优势显著,并通过改进的思维模型架构展现了增强的推理和编码能力。
OpenAI 已向公众推出其视频生成技术 Sora,并采取了包括 C2PA 元数据、水印和滥用防护在内的安全措施。该系统在物理学和复杂动作方面存在已知限制,但代表了人工智能驱动视频创作能力的重大进步。
一段来自 Google DeepMind 的视频,标题为“Project Genie | Silver Sphere”,没有音轨,因此无法提取技术细节。标题暗示这可能是一个人工智能模型或项目的发布。
Black Forest Labs 发布了 Flux 2 Pro,一款全新的图像生成与编辑模型,在文本渲染、逼真度和角色一致性方面均有提升。该模型已通过 Replicate 的 API 提供。
Pruna的p-image-edit是一款运行在Replicate平台上的高端AI模型,能够在一秒内快速完成业界领先的图像编辑,兼具速度、经济性和高视觉质量,精准遵循提示词并具备强大的文字渲染能力。