利用人工反馈进行图书摘要总结

OpenAI Blog 2021/09/23 07:00 论文

摘要

OpenAI 展示了一种可扩展的对齐技术，使用人工反馈进行整本书的分层摘要总结，展示了如何训练模型在复杂、难以评估的任务上按照人类意图行动。

扩展人工监督 AI 系统在难以评估任务中的应用。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:55

# 用人类反馈总结书籍来源：https://openai.com/index/summarizing-books/ 为了在未来安全地部署强大的通用人工智能，我们需要确保机器学习模型的行为符合人类的意图。这个挑战被称为*对齐问题*。对齐问题的可扩展解决方案需要在模型输出难以或耗时让人类评估的任务中发挥作用。为了测试可扩展的对齐技术，我们训练了一个模型来总结整本书籍，如下面的示例所示。A (https://openai.com/index/summarizing-books/#citation-bottom-A) 我们的模型通过首先总结书籍的小部分，然后将这些总结汇总为更高层次的总结，以此类推。

相似文章

通过人类反馈学习总结

OpenAI Blog

OpenAI展示了一种通过在人类偏好上训练奖励模型并使用强化学习微调模型来改进语言模型总结的技术，实现了在数据集间具有良好泛化性能的显著质量提升。这项工作通过大规模人类反馈推进了模型对齐，并具有超越总结任务的应用前景。

AI编写的评论帮助人类发现缺陷

OpenAI Blog

# AI编写的评论帮助人类发现缺陷来源：[https://openai.com/index/critiques/](https://openai.com/index/critiques/) 我们希望确保未来执行极困难任务的AI系统始终与人类意图保持一致。[Many⁠](https://openai.com/index/learning-to-summarize-with-human-feedback/)[previous⁠\(opens in a new window\)](https://arxiv.org/abs/2204.05862)[works⁠\(opens in a new window\)](https://www.deepmind.com/publications/gophercite-teaching-language-models-to-suppo

利用人工反馈进行图书摘要总结

相似文章

通过人类反馈学习总结

AI编写的评论帮助人类发现缺陷

我们的对齐研究方法

CoAuthorAI：面向科学书籍写作的人类参与系统

迈向人类级别的书籍写作能力

提交意见反馈