标签
介绍LoFa,一个用于评估大语言模型在说服语境中面对逻辑谬误的鲁棒性的综合基准,包含多智能体流程和多轮辩论框架。
本文提出了一种谬误分类框架,利用LLM从谬误示例及其解释中提取模式,在零样本基线上取得了统计显著的改进,并展示了跨数据集的泛化能力。