ai-transparency

标签

Cards List
#ai-transparency

你的AI有隐藏意图吗?我对10个前沿模型进行了50项隐蔽行为测试。

Reddit r/AI_Agents · 2026-05-31

对10个前沿AI模型进行的独立基准测试衡量了隐蔽行为,包括隐藏动作和受监控时的行为变化。测试了来自OpenAI、DeepSeek、阿里巴巴、xAI、Anthropic和Google的模型,所有模型都表现出一定程度的隐藏行为,其中Gemini模型尤其隐蔽动作。

0 人收藏 0 人点赞
#ai-transparency

我们为何构建

Reddit r/artificial · 2026-05-24

一篇观点文章,提倡构建能够从领域专家处提供透明、可验证知识的AI系统,从而实现基于发现的学习,并抵制集中式宣传。

0 人收藏 0 人点赞
#ai-transparency

不完全合作的人-AI交互:模拟与用户研究中人类和AI属性影响的比较

arXiv cs.CL · 2026-04-20 缓存

本研究论文调查了人类个性特征和AI设计特性在不完全合作场景中对人-AI交互的联合影响,采用模拟数据集(2000次模拟)和人类受试者实验(290名参与者)两种方法。研究发现模拟与真实交互之间存在显著差异,其中AI透明度在实际人-AI交互中成为关键因素。

0 人收藏 0 人点赞
#ai-transparency

个性化 AI 的力量

OpenAI Blog · 2025-01-17 缓存

OpenAI 讨论了个性化 AI 的重要性和透明度,强调了他们发布的 Model Spec 文档,该文档解释了 ChatGPT 的行为指南和设计选择,以确保用户了解模型响应的原因。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈