logichard

标签

Cards List
#logichard

从零阶选择到二阶判断:组合硬化暴露前沿大语言模型的组合性缺陷

arXiv cs.CL · 2天前 缓存

本文介绍了 LogiHard,这是一个利用组合硬化来暴露前沿大语言模型组合性缺陷的框架,展示了模型在逻辑推理任务中准确率的显著下降。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈