AI检测器有多准确？

Reddit r/artificial 2026/06/07 03:30 新闻

ai-detection accuracy writing tools inconsistency human-writing

摘要

一位作家在对自己亲手撰写的影评进行检测时，发现不同AI检测工具给出了截然不同的结果，从而质疑AI检测工具的准确性，凸显当前AI检测器的不可靠性。

我当影评人已有几年时间，偶尔会有人以为我的影评是AI生成的。事实上，我通过大量阅读、英语课程和大量练习，花了多年时间打磨自己的写作风格。正因如此，我的文章往往比较精炼且有结构，我认为这可能是某些AI检测工具将其误判的原因。我好奇的是，这些AI检测器到底有多准确。有些人将我的作品与AI生成的文字相比较，而当我用不同的AI检测器测试自己的影评时，结果却完全不同。比如，一个检测器可能说某篇影评100%由AI生成，另一个说70%或80%，还有的则将其判定为完全由人类撰写。有的工具说是AI写的，有的说是人写的，结果五花八门。我的影评没有一篇是AI生成的。我发表的所有影评都是完全由我自己撰写的，没有借助AI来生成任何部分。我只是不明白，同一篇文章在不同检测器下为何会有如此巨大的差异。这些工具到底有没有一点准确性可言？

查看原文

相似文章

我是一名专业事实核查员。AI的错误比你想象的更频繁

Wired

WIRED的一位专业事实核查员分享说，AI并不可靠，估计大约三分之一的AI生成信息是错误的，并主张人类的监督仍然至关重要。

这是一个AI胡说检测器：我每天使用它，它能捕捉到你独自发现不了的问题

Reddit r/artificial

一款名为Lighthouse的工具，由一位AI治理工程师构建，利用运行时验证来检测AI输出和写作中的认知漂移以及听起来自信的胡说八道。

AI能否判断你的剧本能否成为卖座电影？

The Verge

本文探讨了Quilty，一家声称通过分析剧本预测电影成功的AI初创公司，但早期测试显示其准确性不佳，并引发了行业质疑。

Open ai

Reddit r/ArtificialInteligence

文章讨论了行业共识：人工智能正变得极其强大，但在高风险任务上的可靠性仍是一个未解决的工程问题。强调当前系统优化的是合理性而非确定性真理，前进方向是分层验证系统而非单一完美模型。

AI编写的评论帮助人类发现缺陷

OpenAI Blog

# AI编写的评论帮助人类发现缺陷来源：[https://openai.com/index/critiques/](https://openai.com/index/critiques/) 我们希望确保未来执行极困难任务的AI系统始终与人类意图保持一致。[Many⁠](https://openai.com/index/learning-to-summarize-with-human-feedback/)[previous⁠\(opens in a new window\)](https://arxiv.org/abs/2204.05862)[works⁠\(opens in a new window\)](https://www.deepmind.com/publications/gophercite-teaching-language-models-to-suppo