标签
文章认为,公司过度投资于AI智能(模型能力),而忽视了权威性、问责性和现实表示等关键运行时层,导致AI在机构内行动时可能出现失败。
本文指出,当前的AI记忆产品优先考虑个性化而非真实性和可问责性,导致系统积累矛盾且无法可靠修正;文章质疑个性化是否足以用于生产环境。
本文探讨了当AI代理提供错误建议时谁应该负责的问题,考虑了开发者、模型提供商、数据供应商、平台和用户的作用,并提出了构建可信代理生态系统的关键问题。
本文认为,在多智能体社交应用中,用户应为其智能体的行为负责,将责任从开发者转移到用户,以确保对齐和实践测试。
作者介绍了一个开源AI Agent Registry,它为智能体分配唯一的合规UUID,支持违规报告和查询,以促进自主AI系统的问责制和信任。
人机交互协议(Human Interaction Protocol)是一项旨在明确权责并优化 AI 智能体与人类在工作流中协作的新标准。它提供了一套结构化的 JSON 模式,用于处理审批、反馈及审计追踪。
耶鲁大学伦理学家温德尔·沃拉奇认为,与当前AI系统(特别是自主武器和分布式责任方面)亟需建立问责制相比,追求AGI(通用人工智能)是舍本逐末。
本文介绍了功能性意向性测试(FIT)和 FIT-Eval 框架,旨在量化代理型人工智能系统中类意向行为程度,以服务于治理与问责目的。
两名南非内政部官员因一份关于公民身份和移民的关键政策文件中被发现含有AI生成的“幻觉”内容而被停职,凸显了政府在未受监管的情况下使用AI所带来的风险。
STRIKE 是一款全新的习惯追踪应用,以严苛问责、毫不留情的风格督促你坚持日常,上线首日即登上 ProductHunt 生产力工具推荐。
本论文分析了加拿大联邦AI登记册(409个系统),论证此类透明度工具通过本体论设计来配置问责制,而非实现真正的可争议性,发现86%的系统专注于内部效率,而人为判断权被系统性地隐蔽。
OpenAI向NTIA提交正式意见,阐述其基础模型负责任开发的方法,并支持在人工智能生态系统中建立水平和垂直问责框架。
OpenAI 发布了一份报告,介绍了提升 AI 开发可验证性的机制,说明了利益相关者如何验证组织关于 AI 系统属性和安全实践的声明。