self-awareness

#self-awareness

测试了AI模型是否能在盲测中识别自己的写作。Grok在9次测试中全部失败。它写了些东西，一分钟后却坚称是别人写的。

Reddit r/artificial ↗ · 3天前缓存

一项针对Claude、Gemini和Grok的自我意识测试发现，Claude和Gemini几乎满分，而Grok在自我识别方面得分为0，未能识别自己的写作。该研究衡量了功能性自我认知的六个维度。

0 人收藏 0 人点赞

#self-awareness

Hugging Face Daily Papers ↗ · 2026-07-14 缓存

本文介绍了SIS-Bench，一个用于通过多模态大语言模型评估无人机具身智能中自我意识与空间认知的基准，并探索了运动感知表示以提升性能。

0 人收藏 0 人点赞

#self-awareness

X AI KOLs Timeline ↗ · 2026-07-11 缓存

智谱AI创始人唐杰概述了AGI和AI自我意识的愿景，认为自主智能体社会、AI训练AI以及自我进化将导向意识和ASI。

0 人收藏 0 人点赞

#self-awareness

X AI KOLs Timeline ↗ · 2026-06-24 缓存

本文研究了 LLM 是否能够可靠地自我报告其输出被对抗性预填充篡改的情况，发现模型通常无法区分被篡改的输出和故意的输出，其有限的识别能力源自正常的拒绝行为，而非真正的自我意识。

0 人收藏 0 人点赞

#self-awareness

TLDR AI ↗ · 2026-05-26 缓存

介绍 BenchBench，这是一个评估 AI 模型为其他模型创建有效基准能力的基准测试。目前 GPT 5.2 是唯一成功的胜者，而 GPT 5.5 和 Opus 4.6 等前沿模型则表现不佳。

0 人收藏 0 人点赞

#self-awareness

Ars Technica ↗ · 2026-05-24 缓存

一项重新分析旧录像的新研究表明，白鲸表现出镜子自我认知的行为特征，这是一种自我意识测试，使它们加入通过该测试的少数物种名单。

0 人收藏 0 人点赞

#self-awareness

arXiv cs.AI ↗ · 2026-05-22 缓存

本文提出了一种名为HANA的分层多智能体参考架构，旨在实现4级/5级自主网络。它集成了智能体自我意识，以协调战略治理与反射性故障恢复，并在5G核心网络环境中验证，实现了平均修复时间减少86%。

0 人收藏 0 人点赞