标签
本文引入了 IntentGrasp,这是一个用于评估大型语言模型意图理解能力的综合基准测试,揭示了 20 个测试模型表现不佳的问题。论文提出了有意图微调(Intentional Fine-Tuning, IFT)作为解决方案,该方法显著提升了模型性能,并展现出强大的跨领域泛化能力。