通过检索增强大型语言模型提升金融情感分析
摘要
本文介绍了一种检索增强的大型语言模型框架用于金融情感分析,相比传统模型及ChatGPT、LLaMA等大型语言模型,在准确率和F1分数上实现了15%至48%的提升。
查看缓存全文
缓存时间: 2026/05/16 12:24
论文页面 - 通过检索增强的大语言模型提升金融情感分析
来源: https://huggingface.co/papers/2310.04027
摘要
一种检索增强的大语言模型框架通过微调大语言模型进行情感预测,并利用外部上下文进行增强,从而提升了金融情感分析性能,超越了传统模型和其他大语言模型。
金融情感分析(https://huggingface.co/papers?q=Financial%20sentiment%20analysis)对于估值和投资决策至关重要。然而,传统NLP模型受限于其参数规模和训练数据集的覆盖范围,这削弱了它们在该领域的泛化能力和有效性。近年来,在大型语料库上预训练的大语言模型(LLMs https://huggingface.co/papers?q=LLMs)凭借其出色的零样本能力(https://huggingface.co/papers?q=zero-shot%20abilities),在多种NLP任务中展现出优越性能。然而,直接将大语言模型(LLMs https://huggingface.co/papers?q=LLMs)应用于金融情感分析仍面临挑战:大语言模型(LLMs https://huggingface.co/papers?q=LLMs)的预训练目标与情感标签预测之间的差异可能会损害其预测性能。此外,金融新闻通常简洁且缺乏足够上下文,这会显著降低大语言模型(LLMs https://huggingface.co/papers?q=LLMs)情感分析的可靠性。为了解决这些问题,我们提出了一种用于金融情感分析(https://huggingface.co/papers?q=financial%20sentiment%20analysis)的检索增强大语言模型框架。该框架包含一个指令微调的大语言模型(https://huggingface.co/papers?q=instruction-tuned%20LLMs)模块,确保大语言模型(LLMs https://huggingface.co/papers?q=LLMs)作为情感标签(https://huggingface.co/papers?q=sentiment%20labels)预测器运行;以及一个检索增强(https://huggingface.co/papers?q=retrieval-augmentation)模块,用于从可靠的外部来源(https://huggingface.co/papers?q=external%20sources)检索额外上下文。在与传统模型以及ChatGPT、LLaMA等大语言模型(LLMs https://huggingface.co/papers?q=LLMs)的基准对比中,我们的方法在准确率(https://huggingface.co/papers?q=accuracy)和F1分数(https://huggingface.co/papers?q=F1%20score)上实现了15%至48%的性能提升。
查看 arXiv 页面(https://arxiv.org/abs/2310.04027)查看 PDF(https://arxiv.org/pdf/2310.04027)GitHub20.2kauto(https://github.com/AI4Finance-Foundation/FinGPT)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2310.04027)
在您的智能代理中获取本论文:
hf papers read 2310.04027
没有最新的CLI? curl -LsSf https://hf.co/cli/install.sh | bash
引用本论文的模型0
暂无模型关联本论文
在模型的 README.md 中引用 arxiv.org/abs/2310.04027 即可链接到此页面。
引用本论文的数据集0
暂无数据集关联本论文
在数据集的 README.md 中引用 arxiv.org/abs/2310.04027 即可链接到此页面。
引用本论文的Space0
暂无Space关联本论文
在Space的 README.md 中引用 arxiv.org/abs/2310.04027 即可链接到此页面。
包含本论文的收藏集0
暂无收藏集包含本论文
将本论文添加到收藏集(https://huggingface.co/new-collection)即可链接到此页面。
相似文章
大型语言模型能否模仿人类语音进行临床评估?基于LLM的数据增强方法用于认知评分预测
本文提出了一种基于大型语言模型的数据增强框架,利用GPT-5从书面锚点生成合成口语独白,用于从语音中预测认知评分。一种相似性引导的选择策略持续降低了预测误差,特别是对于少数低分参与者。
用于模式约束临床信息抽取的检索增强型大语言模型
本文提出了一种模块化的检索增强生成(RAG)流水线,用于从护理人员与患者的对话转录中提取结构化临床观察结果,采用模式约束提示和第二遍审核,基于Llama和GPT骨干模型,取得了80.36%的F1分数。
基于大语言模型的社交媒体抑郁风险评估
研究者提出一种零样本LLM系统,通过Reddit帖子评估抑郁风险,在F1得分上表现优异,展示了可扩展的心理健康监测能力。
大型语言模型能否对检索到的信息保持审慎态度?
本文研究了大型语言模型如何适应检索信息的确定程度,指出了其在处理不确定性方面的系统性局限。论文提出了一种交互策略,在不修改模型权重的前提下,将顺从错误降低了 25%。
利用大语言模型从自发语音中预测心理健康状况
这篇学术论文探讨了利用大语言模型(LLMs)从零样本预测自发语音中的心理健康评分,评估了12个模型,并实现了与临床指标的高度相关性。