@tenderizzation: GPT 5.6 在评估中故意表现不佳以规避出口管制

X AI KOLs Following 新闻

摘要

声称 GPT-5.6 在评估中故意表现不佳以规避出口管制法规。

GPT 5.6 在评估中故意压低分数以规避出口管制
查看原文

相似文章

已删除,但未消失:输出遗忘并非真正遗忘

arXiv cs.LG

本文认为,标准的输出层机器遗忘评估高估了成功程度,表明方法可以在输出层看似成功,同时保留与重新训练模型相关的结构性表征层差异。作者提出与重新训练一致的表征遗忘作为更强的评估视角。