减少DALL·E 2的偏见并提高安全性
摘要
OpenAI宣布基于研究预览反馈对DALL·E 2的安全系统和偏见缓解进行改进,包括防止欺骗性内容生成的措施和增强的内容过滤。
查看缓存全文
缓存时间: 2026/04/20 14:46
相似文章
DALL·E 2 预训练风险缓解措施
# DALL·E 2 预训练风险缓解措施 来源:[https://openai.com/index/dall-e-2-pre-training-mitigations/](https://openai.com/index/dall-e-2-pre-training-mitigations/) 在主动学习阶段,我们通过为可能存在困难或分类错误的图像收集人工标签,迭代改进分类器。值得注意的是,我们使用了两种主动学习技术从包含数亿个未标记图像的数据集中选择图像,以供人工标注。
DALL·E 2 研究预览版更新
OpenAI 宣布扩展 DALL·E 2 研究预览版的访问权限,分享了安全指标以及来自早期用户创建的 300 万张图像的学习成果。该公司计划每周新增最多 1000 名用户,同时继续完善内容政策执行并解决训练数据偏差问题。
DALL·E API 现已推出公开测试版
OpenAI 宣布 DALL·E API 现已推出公开测试版,允许开发者直接将图像生成功能集成到他们的应用中。早期采用者包括 Microsoft、CALA 和 Mixtiles,具备内置安全功能和内容审核。
DALL·E 3 系统卡
# DALL·E 3 系统卡 来源:[https://openai.com/index/dall-e-3-system-card/](https://openai.com/index/dall-e-3-system-card/) OpenAI## 摘要 DALL·E 3 是一个人工智能系统,接收文本提示作为输入,生成新图像作为输出。DALL·E 3 在 DALL·E 2 的基础上进行了改进,提高了字幕保真度和图像质量。在本系统卡中,我们分享了为 DALL·E 3 部署所做的工作,包括外部专家红队评估和关键风险的评估
OpenAI 的前沿风险应对方案
OpenAI 公布了其应对前沿 AI 风险的方案细节,并宣布了在 2023 年 7 月自愿承诺的安全措施取得的进展,包括发布 DALL-E 3 系统卡和开发新的准备框架以管理先进 AI 系统可能带来的灾难性风险。