self-awareness

#self-awareness

介绍 BenchBench（5分钟阅读）

TLDR AI ↗ · 2026-05-26 缓存

介绍 BenchBench，这是一个评估 AI 模型为其他模型创建有效基准能力的基准测试。目前 GPT 5.2 是唯一成功的胜者，而 GPT 5.5 和 Opus 4.6 等前沿模型则表现不佳。

0 人收藏 0 人点赞

#self-awareness

Ars Technica ↗ · 2026-05-24 缓存

一项重新分析旧录像的新研究表明，白鲸表现出镜子自我认知的行为特征，这是一种自我意识测试，使它们加入通过该测试的少数物种名单。

0 人收藏 0 人点赞

#self-awareness

arXiv cs.AI ↗ · 2026-05-22 缓存

本文提出了一种名为HANA的分层多智能体参考架构，旨在实现4级/5级自主网络。它集成了智能体自我意识，以协调战略治理与反射性故障恢复，并在5G核心网络环境中验证，实现了平均修复时间减少86%。

0 人收藏 0 人点赞