标签
本文识别了多利益相关方任务中LLM评估者的权重噪声,并提出了DecompR方法,该方法通过反事实校准的权重将效用估计从聚合中解耦。
一项多机构调查提出了一个三层信任框架,以协调技术、临床和以人为中心的需求,打造用于心理健康支持的可信 AI。
OpenAI 和加州大学伯克利分校举办的人工智能信任建立措施研讨会汇集了各方利益相关者,旨在制定策略以缓解基础模型带来的地缘政治风险,并确定了六项关键措施,包括危机热线、事件信息共享、模型透明度、内容溯源、红队测试和数据集共享。