标签
tropius 是一个命令行工具,使用Aho-Corasick模式匹配和结构检测器来检测散文中的AI写作套路,基于Tropes.fyi的套路列表。
本文提出了一种基于半监督学习的测试时自适应方法,用于AI文本检测,能够适应来自新LLM、对抗性人工化和时间漂移的持续分布变化,性能优于最先进的监督式检测器。
Pangram Labs探索其AI检测模型Pangram 3.3.2的内部表示,分析模型如何在不同层中区分人工文本与AI文本,使用来自多种来源的5,000份文档的平衡数据集。
Superhuman,一家电子邮件客户端公司,已同意收购GPTZero,一个由Edward Tian创立的人工智能检测工具。
一份全面的去AI味写作指南,从识别22种AI写作特征到提供改写流程和提示词,帮助用户消除AI写作痕迹。
repo-slopscore 是一个分析 Git 提交历史以检测 AI 或大语言模型贡献的工具,帮助开发者识别仓库中由 AI 生成的代码。
StackScope分析了超过4万个独立产品发布,揭示技术栈、AI使用情况、安全头部和托管细节。它每天从Product Hunt、Hacker News和PeerPush提供洞察。
Deezer 推出了一款免费在线工具,可扫描来自多个流媒体平台的播放列表,识别 AI 生成的曲目,从而将自己定位为 AI 音乐透明度领域的领导者。
Deezer推出了一款AI音乐检测器,可扫描其他流媒体平台上的播放列表以识别AI生成的音乐,在其他平台未能采用其技术后,直接向用户提供该功能。
一位作家在对自己亲手撰写的影评进行检测时,发现不同AI检测工具给出了截然不同的结果,从而质疑AI检测工具的准确性,凸显当前AI检测器的不可靠性。
莱拉和亚历克斯·霍莫齐发布了一份内部备忘录,禁止在公司内使用AI生成的内容,并提供了识别和避免企业沟通中“AI垃圾内容”的技巧。
一个1B模型,采用堆叠的SFT和DPO LoRA适配器,在RADAR AI检测器上达到人类水平得分,将冗余短语减少到零,并在24GB Mac上运行。
本文研究了LLM后训练如何引入类似AI的风格规律,并提出了PASTA,一种无需训练的方法来定位和消除这些对齐特征,从而在11个模型和6个检测器上降低AI检测率同时保持连贯性。
本文探讨了LLM的后训练(RLHF和RLVR)如何产生诸如否定平行结构之类的语言特征,并批评了使用AI检测工具(Grammarly、Pangram)的做法,这些工具迫使写作者为了避免被误判而模仿机器语言。
在有关虚构引用的报道后,WIRED调查了Steve Rosenbaum的著作《未来真相》,揭示了他使用ChatGPT和Claude等AI工具的情况,以及验证AI生成内容的难度。
一项分析表明,教皇利奥十四世关于AI对人类影响的通谕中部分内容可能由AI撰写,AI检测器标记出某些段落高达62%为AI生成,尽管检测并非万无一失。
一篇来自Futurism的文章报道,45%的人故意在数字文本中添加错别字,以显示人性化并规避AI检测器。研究表明,这种错误能提高企业邮件的阅读率和信任度。