@TowardMu: https://x.com/TowardMu/status/2069194694228431273
摘要
介绍Apodex,一个自进化型重型求解器,采用verification-centric agent team架构进行深度研究,支持自我求解、证据链验证等功能,目前处于抢先体验阶段且完全免费。
查看缓存全文
缓存时间: 2026/06/23 14:10
2026 年 AI Agent 赛道里最有潜力的几家公司,其市场表现值得重点关注。
只用一个自进化型的重型求解器,就帮我找出了 2026 年 AI Agent 赛道里最有潜力的几家公司。Apodex工具的数据挖掘能力非常强。
**完整报告我放在这里:**https://www.apodex.ai/report/share/iler76uTPTn6i
全程只用一个工具,叫Apodex。它是一个面向深度研究而打造的自进化型重型求解器( Self-Evolving Heavy-Duty Solver) 它的 Deep research 逻辑非常强,可以通过自我求解来挖掘出未确定性的答案,还支持打印出报告结果。
它的设计思路是这样的:
Apodex 没有把 deep research 理解成一个更长的 ReAct loop,而是把它拆成一个 agent team 。
包括:主 agent 拆任务、子 agent 并行探索、冲突 reviewer 专门处理不一致、fact checker 查证具体 claim、draft reviewer 审最终稿、global verifier 在最后对整套证据做审核。
这个方式完美解决了对话里上下文越来越挤、早期错误会污染后续推理、反思环节还是在同一个认知框架里打转的错误行为。
Apodex 官方把这个逻辑流程叫 verification-centric agent team。通过给 deep research 加“反对派”,用证据链,来源的冲突性,结论的推出方式等做自我判断。
Apodex这个设计极其适合做科学研究、医学机制、新材料、法律检索、投研判断这些行业。因为这类问题没有确切答案。你需要系统持续找证据、推翻假设、修正草稿、重新组织结论。
目前工具还处于抢先体验(Early access)阶段,完全免费,大家可以直接去官方网页体验!
工具地址:https://www.apodex.ai/ 开源模型 / harness: https://github.com/ApodexAI
https://huggingface.co/apodex
相似文章
@Apodex_AI: 认识 𝗔𝗽𝗼𝗱𝗲𝘅 𝟭.𝟬 — 一个用于深度研究的重型智能体团队,树立了最新技术水平(SOTA)!该团队搜索网络,阅读…
Apodex 1.0 是一个用于深度研究的重型AI智能体团队,通过搜索网络、推理证据并生成带有可验证证据链的报告,实现了最先进的性能(SOTA)。
@heyshrutimishra: Apodex 1.0 发布,架构确实与众不同。它基于 Qwen3.5 进行后训练,成为一个自我进化的系统:…
Apodex 1.0 是一个基于 Qwen3.5 后训练的自我进化 AI 系统,在 BrowseComp、DeepSearchQA 和 HLE-text 上达到 SOTA。其 4B 迷你模型性能超越 30B 级别模型,并配有 AgentOS 运行时用于任务编排。开放权重可用。
@Apodex_AI: 深入阅读博客:https://apodex.com/blog/apodex-1.0 技术报告:http://apodex.com/pdf/20260608 GitHub:https://github.com…
ApodexAI 发布了 Apodex-1.0,这是一个深度研究模型,作为使用工具的 ReAct 代理运行。其重型模式 Apodex-1.0-H 采用异步代理团队,最多包含 150 个子代理,在深度研究基准测试(包括 BrowseComp、DeepSearchQA、HLE 和 FrontierScience)上取得了新的最先进结果,超越了 GPT-5.5-pro 和 Claude-Opus-4.8 等模型。
推出 AgentOS 与 Apodex 1.0:专为通过独立验证阻止长周期智能体漂移而构建的运行时与模型家族
AgentOS 和 Apodex 1.0 引入了一个用于长周期智能体任务的运行时和开放权重模型家族,通过独立验证来防止智能体漂移。该平台包含怀疑性子智能体,并在复杂基准测试中取得了高分。
@sheriyuo: Best-of-N、拒绝采样和基于评分标准的排序都假设你已经有一种可靠的方法来评估候选答案…
Apodex 发布了 Apodex-1.0,一个深度研究模型,它使用一个带有全局验证的重型代理团队,在包括 BrowseComp、DeepSearchQA 和 HLE 在内的多个基准测试中取得了最先进的结果。