@heyshrutimishra: Apodex 1.0 发布,架构确实与众不同。它基于 Qwen3.5 进行后训练,成为一个自我进化的系统:…
摘要
Apodex 1.0 是一个基于 Qwen3.5 后训练的自我进化 AI 系统,在 BrowseComp、DeepSearchQA 和 HLE-text 上达到 SOTA。其 4B 迷你模型性能超越 30B 级别模型,并配有 AgentOS 运行时用于任务编排。开放权重可用。
查看缓存全文
缓存时间: 2026/06/17 21:59
Apodex 1.0 正式发布,其架构确实与众不同。
该系统基于 Qwen3.5 进行后训练,形成自进化体系:数学、编程和通用知识保持完整,而深度研究能力会随时间累积增长。不存在灾难性遗忘问题。这种平衡的构建难度远超想象。
重型能力方面:1.0-H 模型可并行运行多达 150 个子代理,同时进行网络探索。独立的验证层在最终报告生成前会审核每项声明。这不仅仅是搜索加摘要——整个流程中内置了实际的冲突解决机制。
数据表现:BrowseComp 90.3,DeepSearchQA 94.4,HLE-text 60.8。目前在开源和闭源模型中都处于领先地位。
值得关注的是:其 4B 迷你模型在 BrowseComp 和 DeepSearchQA 上击败了所有 30B 级别的开源模型。更小、更便宜、研究能力更强。规模化的叙事正在悄然转变。
这一切的底层是 AgentOS,一个任务无关的运行时系统,负责调度、路由、检查点和成本核算。工作流逻辑位于其上的插件中,因此添加新应用只需一个代码文件夹。
权重也已开放。如果你正在构建研究管线,或思考代理编排应该如何真正结构化,值得一看。
Apodex (@Apodex_AI): 立即探索 👇 📝 博客:https://t.co/EsoHMhVkTJ 📄 技术报告:https://t.co/RSqhTB7dXo 💻 GitHub:https://t.co/IbXL6BE1IP 🤗 Hugging Face:https://t.co/3aAE5Z8Th6 💬 Discord:https://t.co/GNxDhYuwmd ⏬ API平台:
相似文章
@Apodex_AI: 深入阅读博客:https://apodex.com/blog/apodex-1.0 技术报告:http://apodex.com/pdf/20260608 GitHub:https://github.com…
ApodexAI 发布了 Apodex-1.0,这是一个深度研究模型,作为使用工具的 ReAct 代理运行。其重型模式 Apodex-1.0-H 采用异步代理团队,最多包含 150 个子代理,在深度研究基准测试(包括 BrowseComp、DeepSearchQA、HLE 和 FrontierScience)上取得了新的最先进结果,超越了 GPT-5.5-pro 和 Claude-Opus-4.8 等模型。
发布 Apodex-1.0 Smol 模型(0.8B、2B、4B 开源权重),专为智能体验证优化 + AgentHarness 评估
Apodex 发布了开源权重的小型模型(0.8B、2B、4B),专为智能体验证任务优化,同时推出了用于本地智能体工作流的 AgentHarness 评估框架。
@Apodex_AI: 认识 𝗔𝗽𝗼𝗱𝗲𝘅 𝟭.𝟬 — 一个用于深度研究的重型智能体团队,树立了最新技术水平(SOTA)!该团队搜索网络,阅读…
Apodex 1.0 是一个用于深度研究的重型AI智能体团队,通过搜索网络、推理证据并生成带有可验证证据链的报告,实现了最先进的性能(SOTA)。
@sheriyuo: Best-of-N、拒绝采样和基于评分标准的排序都假设你已经有一种可靠的方法来评估候选答案…
Apodex 发布了 Apodex-1.0,一个深度研究模型,它使用一个带有全局验证的重型代理团队,在包括 BrowseComp、DeepSearchQA 和 HLE 在内的多个基准测试中取得了最先进的结果。
推出 AgentOS 与 Apodex 1.0:专为通过独立验证阻止长周期智能体漂移而构建的运行时与模型家族
AgentOS 和 Apodex 1.0 引入了一个用于长周期智能体任务的运行时和开放权重模型家族,通过独立验证来防止智能体漂移。该平台包含怀疑性子智能体,并在复杂基准测试中取得了高分。