AI检测器有多准确?

Reddit r/artificial 新闻

摘要

一位作家在对自己亲手撰写的影评进行检测时,发现不同AI检测工具给出了截然不同的结果,从而质疑AI检测工具的准确性,凸显当前AI检测器的不可靠性。

我当影评人已有几年时间,偶尔会有人以为我的影评是AI生成的。事实上,我通过大量阅读、英语课程和大量练习,花了多年时间打磨自己的写作风格。正因如此,我的文章往往比较精炼且有结构,我认为这可能是某些AI检测工具将其误判的原因。我好奇的是,这些AI检测器到底有多准确。有些人将我的作品与AI生成的文字相比较,而当我用不同的AI检测器测试自己的影评时,结果却完全不同。比如,一个检测器可能说某篇影评100%由AI生成,另一个说70%或80%,还有的则将其判定为完全由人类撰写。有的工具说是AI写的,有的说是人写的,结果五花八门。我的影评没有一篇是AI生成的。我发表的所有影评都是完全由我自己撰写的,没有借助AI来生成任何部分。我只是不明白,同一篇文章在不同检测器下为何会有如此巨大的差异。这些工具到底有没有一点准确性可言?
查看原文

相似文章

Open ai

Reddit r/ArtificialInteligence

文章讨论了行业共识:人工智能正变得极其强大,但在高风险任务上的可靠性仍是一个未解决的工程问题。强调当前系统优化的是合理性而非确定性真理,前进方向是分层验证系统而非单一完美模型。

AI编写的评论帮助人类发现缺陷

OpenAI Blog

# AI编写的评论帮助人类发现缺陷 来源:[https://openai.com/index/critiques/](https://openai.com/index/critiques/) 我们希望确保未来执行极困难任务的AI系统始终与人类意图保持一致。[Many⁠](https://openai.com/index/learning-to-summarize-with-human-feedback/)[previous⁠\(opens in a new window\)](https://arxiv.org/abs/2204.05862)[works⁠\(opens in a new window\)](https://www.deepmind.com/publications/gophercite-teaching-language-models-to-suppo