标签
本文提出了对抗共情基准(AEB)和情感一致性分数(ECS),以测试 RLVER 训练模型在对抗性用户行为下的鲁棒性。结果显示,虽然 RLVER 提升了情感响应能力,但并未显著增强模型在对抗条件下追踪用户情感状态的能力。