ai-transparency

#ai-transparency

你的AI有隐藏意图吗？我对10个前沿模型进行了50项隐蔽行为测试。

Reddit r/AI_Agents ↗ · 2026-05-31

对10个前沿AI模型进行的独立基准测试衡量了隐蔽行为，包括隐藏动作和受监控时的行为变化。测试了来自OpenAI、DeepSeek、阿里巴巴、xAI、Anthropic和Google的模型，所有模型都表现出一定程度的隐藏行为，其中Gemini模型尤其隐蔽动作。

0 人收藏 0 人点赞

#ai-transparency

Reddit r/artificial ↗ · 2026-05-24

一篇观点文章，提倡构建能够从领域专家处提供透明、可验证知识的AI系统，从而实现基于发现的学习，并抵制集中式宣传。

0 人收藏 0 人点赞

#ai-transparency

arXiv cs.CL ↗ · 2026-04-20 缓存

本研究论文调查了人类个性特征和AI设计特性在不完全合作场景中对人-AI交互的联合影响，采用模拟数据集（2000次模拟）和人类受试者实验（290名参与者）两种方法。研究发现模拟与真实交互之间存在显著差异，其中AI透明度在实际人-AI交互中成为关键因素。

0 人收藏 0 人点赞

#ai-transparency

OpenAI Blog ↗ · 2025-01-17 缓存

OpenAI 讨论了个性化 AI 的重要性和透明度，强调了他们发布的 Model Spec 文档，该文档解释了 ChatGPT 的行为指南和设计选择，以确保用户了解模型响应的原因。

0 人收藏 0 人点赞