标签
介绍 BenchBench,这是一个评估 AI 模型为其他模型创建有效基准能力的基准测试。目前 GPT 5.2 是唯一成功的胜者,而 GPT 5.5 和 Opus 4.6 等前沿模型则表现不佳。
一项重新分析旧录像的新研究表明,白鲸表现出镜子自我认知的行为特征,这是一种自我意识测试,使它们加入通过该测试的少数物种名单。
本文提出了一种名为HANA的分层多智能体参考架构,旨在实现4级/5级自主网络。它集成了智能体自我意识,以协调战略治理与反射性故障恢复,并在5G核心网络环境中验证,实现了平均修复时间减少86%。