标签
中国AI初创公司Z.ai发布其开源模型GLM-5.2,该模型在基准测试中得分接近美国顶尖模型Anthropic和OpenAI,并宣布计划在上海进行双重上市。
据 @synthwavedd 的帖子报道,《Fable 5》已重新出现在 Amazon Bedrock 上。
Google 宣布计算机使用现已成为 Gemini 3.5 Flash 的内置工具,使开发者能够构建可在浏览器、移动设备和桌面环境中进行观察、推理和操作的智能体。
推文宣布了 Gemma 4 31B 多模态模型,速度快如火箭,称这是通往超级智能的第一步。
欧洲初创公司 Domyn 宣布推出一款新的 4000 亿参数 AI 模型,继其现有的 2600 亿参数闭源模型和 100 亿参数开源模型之后。
Qwen 发布了新的大语言模型 Qwen-AgentWorld-397B-A17B,详情请见 HuggingFace 和 Qwen 博客。
Mistral OCR 4 将手写的微积分考试卷转换为干净的LaTeX,准确读取公式并处理图表,但不会重新绘制它们。该模型提供带有边界框和置信度分数的结构化输出,支持170种语言。
GLM 5.2 是一个开源AI模型,拥有100万token的上下文窗口和强大的基准性能,略逊于Opus 4.8。本集提供了使用Cursor和Codex等工具进行本地或云端部署的实用指南,并强调通过串联模型来实现成本效益。
Seedance 2.5 视频AI模型发布,预测将在60天内对库存视频、社交媒体内容创作、广告公司和动画制作造成巨大冲击。
Z.ai 发布了 GLM-5.2,一个开放权重的 AI 模型,代表着开放代理的一次重大变革,具有强劲的基准测试表现和社区热度,使其成为唯一能与 OpenAI 和 Anthropic 的顶级封闭模型竞争的开放模型。
Muennighoff宣布正在开发一个更好的Composer模型,扩展到Opus/GPT级别、从头训练,并超越编码,作为Cursor与SpaceX合作的一部分。
Sakana AI 发布了 Fugu Ultra,这是一种多智能体编排模型,在避免出口管制的同时,其性能媲美 Fable 和 Mythos 的前沿水平。
更新后的GPT-5.5 Cyber模型在CyberGym基准测试中超越了Mythos 5。
OpenAI发布GPT-5.5-Cyber完整版本,这是一款专注于网络安全的AI模型,在CyberGym上达到最先进性能,并宣布通过Patch The Planet和Codex Security提升安全性的努力。
根据泄露信息,OpenAI 的 GPT‑5.6 已接近完成,预计拥有 150 万上下文窗口,价格仅为 Fable 5 的三分之一,前端生成质量显著提升。发布可能推迟至 28 号之后。