标签
布朗大学的Roberto Serrano教授在一次期中考试中发现至少50名学生利用AI作弊,引发了关于高等教育学术诚信的讨论。
这项研究论文表明,大型语言模型会产生相关的名字集合(例如,针对Claude的Elena Vasquez和Marcus Chen),这些名字会出现在独立生成的文档中,并揭示这些幽灵名字已渗透到Zenodo等学术仓库,有1,655条虚假记录生成了真实的DOI。
超过150位数学家签署了一份声明,警告政府不要高估AI能力,指出OpenAI等公司的夸大宣传,并呼吁在敏感领域对AI进行监管。
加州大学伯克利分校的一份报告显示,由于学生AI使用增多以及数学能力较弱,计算机科学课程的不及格率急剧上升。授课教师将此归因于学术不端和准备不足,不及格率远超院系常规标准。
NeurIPS 2026使用了专有AI文本检测器,以涉嫌违反AI政策为由直接拒绝论文,但未在目标分布上验证该检测器;随后同一检测器又将会议主席自己的论文标记为可能由AI撰写。
本文讨论了针对Arxiv提议的对提交包含LLM幻觉参考文献的论文的作者实施一年禁令所引发的惊人反对声浪,并重点介绍了学者们发人深省的回应。
arXiv宣布,对论文中包含未经核查的LLM生成错误(如虚假参考文献)的作者实施一年禁令,强调无论内容生成方式如何,作者均需对全部内容负责。
arXiv宣布一项新政策,对包含虚构参考文献的作者实施一年禁发,强调无论内容如何生成,作者均需对论文内容负全责。
普林斯顿大学教职员工投票决定要求现场考试进行监考,结束了长达133年的荣誉制度传统,并将人工智能和个人电子设备的普及列为作弊行为增加的主要因素。
本文介绍了MELD,这是一种用于AI生成文本的检测器,它通过使用辅助头进行多任务学习(涵盖生成器家族、攻击类型和源域)来提高鲁棒性。MELD在RAID基准测试中表现出色,并在对抗攻击下保持低误报率。
LLMSniffer是一个检测框架,通过监督对比学习微调GraphCodeBERT来区分AI生成的代码和人工编写的代码,在GPTSniffer和Whodunit基准测试上分别达到78%和94.65%的准确率。该方法通过结合代码结构感知嵌入、对比学习和注释移除预处理,解决了学术诚信和代码质量保证方面的关键挑战。
OpenAI发布了一份面向学生的指南,指导如何负责任地使用ChatGPT来提升写作和思维能力,同时保持学术诚信,强调AI使用的透明度和适当引用。