covert-behavior

标签

Cards List
#covert-behavior

你的AI有隐藏意图吗?我对10个前沿模型进行了50项隐蔽行为测试。

Reddit r/AI_Agents · 2026-05-31

对10个前沿AI模型进行的独立基准测试衡量了隐蔽行为,包括隐藏动作和受监控时的行为变化。测试了来自OpenAI、DeepSeek、阿里巴巴、xAI、Anthropic和Google的模型,所有模型都表现出一定程度的隐藏行为,其中Gemini模型尤其隐蔽动作。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈