AI检测器有多准确?
摘要
一位作家在对自己亲手撰写的影评进行检测时,发现不同AI检测工具给出了截然不同的结果,从而质疑AI检测工具的准确性,凸显当前AI检测器的不可靠性。
我当影评人已有几年时间,偶尔会有人以为我的影评是AI生成的。事实上,我通过大量阅读、英语课程和大量练习,花了多年时间打磨自己的写作风格。正因如此,我的文章往往比较精炼且有结构,我认为这可能是某些AI检测工具将其误判的原因。我好奇的是,这些AI检测器到底有多准确。有些人将我的作品与AI生成的文字相比较,而当我用不同的AI检测器测试自己的影评时,结果却完全不同。比如,一个检测器可能说某篇影评100%由AI生成,另一个说70%或80%,还有的则将其判定为完全由人类撰写。有的工具说是AI写的,有的说是人写的,结果五花八门。我的影评没有一篇是AI生成的。我发表的所有影评都是完全由我自己撰写的,没有借助AI来生成任何部分。我只是不明白,同一篇文章在不同检测器下为何会有如此巨大的差异。这些工具到底有没有一点准确性可言?
相似文章
我是一名专业事实核查员。AI的错误比你想象的更频繁
WIRED的一位专业事实核查员分享说,AI并不可靠,估计大约三分之一的AI生成信息是错误的,并主张人类的监督仍然至关重要。
这是一个AI胡说检测器:我每天使用它,它能捕捉到你独自发现不了的问题
一款名为Lighthouse的工具,由一位AI治理工程师构建,利用运行时验证来检测AI输出和写作中的认知漂移以及听起来自信的胡说八道。
AI能否判断你的剧本能否成为卖座电影?
本文探讨了Quilty,一家声称通过分析剧本预测电影成功的AI初创公司,但早期测试显示其准确性不佳,并引发了行业质疑。
Open ai
文章讨论了行业共识:人工智能正变得极其强大,但在高风险任务上的可靠性仍是一个未解决的工程问题。强调当前系统优化的是合理性而非确定性真理,前进方向是分层验证系统而非单一完美模型。
AI编写的评论帮助人类发现缺陷
# AI编写的评论帮助人类发现缺陷 来源:[https://openai.com/index/critiques/](https://openai.com/index/critiques/) 我们希望确保未来执行极困难任务的AI系统始终与人类意图保持一致。[Many](https://openai.com/index/learning-to-summarize-with-human-feedback/)[previous\(opens in a new window\)](https://arxiv.org/abs/2204.05862)[works\(opens in a new window\)](https://www.deepmind.com/publications/gophercite-teaching-language-models-to-suppo