通过检索增强大型语言模型提升金融情感分析

Papers with Code Trending 论文

摘要

本文介绍了一种检索增强的大型语言模型框架用于金融情感分析,相比传统模型及ChatGPT、LLaMA等大型语言模型,在准确率和F1分数上实现了15%至48%的提升。

金融情感分析对于估值和投资决策至关重要。然而,传统的NLP模型受限于其参数规模和训练数据集的覆盖范围,这妨碍了它们在该领域的泛化能力和有效性。近期,在海量语料库上预训练的大型语言模型(LLMs)因其出色的零样本能力而在各种NLP任务中展现出优越性能。然而,直接将LLMs应用于金融情感分析存在挑战:LLMs的预训练目标与情感标签预测之间的差异可能会损害其预测性能。此外,金融新闻的简洁性往往缺乏足够的上下文,这可能会显著降低LLMs情感分析的可靠性。为了解决这些挑战,我们引入了一种检索增强的LLMs框架用于金融情感分析。该框架包括一个指令微调的LLMs模块,确保LLMs充当情感标签的预测器,以及一个检索增强模块,从可靠的外部来源检索额外的上下文。在与传统模型和LLMs(如ChatGPT和LLaMA)的基准测试中,我们的方法在准确率和F1分数上实现了15%至48%的性能提升。
查看原文
查看缓存全文

缓存时间: 2026/05/16 12:24

论文页面 - 通过检索增强的大语言模型提升金融情感分析

来源: https://huggingface.co/papers/2310.04027

摘要

一种检索增强的大语言模型框架通过微调大语言模型进行情感预测,并利用外部上下文进行增强,从而提升了金融情感分析性能,超越了传统模型和其他大语言模型。

金融情感分析(https://huggingface.co/papers?q=Financial%20sentiment%20analysis)对于估值和投资决策至关重要。然而,传统NLP模型受限于其参数规模和训练数据集的覆盖范围,这削弱了它们在该领域的泛化能力和有效性。近年来,在大型语料库上预训练的大语言模型(LLMs https://huggingface.co/papers?q=LLMs)凭借其出色的零样本能力(https://huggingface.co/papers?q=zero-shot%20abilities),在多种NLP任务中展现出优越性能。然而,直接将大语言模型(LLMs https://huggingface.co/papers?q=LLMs)应用于金融情感分析仍面临挑战:大语言模型(LLMs https://huggingface.co/papers?q=LLMs)的预训练目标与情感标签预测之间的差异可能会损害其预测性能。此外,金融新闻通常简洁且缺乏足够上下文,这会显著降低大语言模型(LLMs https://huggingface.co/papers?q=LLMs)情感分析的可靠性。为了解决这些问题,我们提出了一种用于金融情感分析(https://huggingface.co/papers?q=financial%20sentiment%20analysis)的检索增强大语言模型框架。该框架包含一个指令微调的大语言模型(https://huggingface.co/papers?q=instruction-tuned%20LLMs)模块,确保大语言模型(LLMs https://huggingface.co/papers?q=LLMs)作为情感标签(https://huggingface.co/papers?q=sentiment%20labels)预测器运行;以及一个检索增强(https://huggingface.co/papers?q=retrieval-augmentation)模块,用于从可靠的外部来源(https://huggingface.co/papers?q=external%20sources)检索额外上下文。在与传统模型以及ChatGPT、LLaMA等大语言模型(LLMs https://huggingface.co/papers?q=LLMs)的基准对比中,我们的方法在准确率(https://huggingface.co/papers?q=accuracy)和F1分数(https://huggingface.co/papers?q=F1%20score)上实现了15%至48%的性能提升。

查看 arXiv 页面(https://arxiv.org/abs/2310.04027)查看 PDF(https://arxiv.org/pdf/2310.04027)GitHub20.2kauto(https://github.com/AI4Finance-Foundation/FinGPT)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2310.04027)

在您的智能代理中获取本论文:

hf papers read 2310.04027

没有最新的CLI? curl -LsSf https://hf.co/cli/install.sh | bash

引用本论文的模型0

暂无模型关联本论文

在模型的 README.md 中引用 arxiv.org/abs/2310.04027 即可链接到此页面。

引用本论文的数据集0

暂无数据集关联本论文

在数据集的 README.md 中引用 arxiv.org/abs/2310.04027 即可链接到此页面。

引用本论文的Space0

暂无Space关联本论文

在Space的 README.md 中引用 arxiv.org/abs/2310.04027 即可链接到此页面。

包含本论文的收藏集0

暂无收藏集包含本论文

将本论文添加到收藏集(https://huggingface.co/new-collection)即可链接到此页面。

相似文章

用于模式约束临床信息抽取的检索增强型大语言模型

arXiv cs.CL

本文提出了一种模块化的检索增强生成(RAG)流水线,用于从护理人员与患者的对话转录中提取结构化临床观察结果,采用模式约束提示和第二遍审核,基于Llama和GPT骨干模型,取得了80.36%的F1分数。