使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 模型进行指令微调

arXiv cs.AI 2026/06/10 04:00 论文

financial-ner named-entity-recognition deepseek lora neftune instruction-finetuning open-source

摘要

本文研究了使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 进行指令微调用于金融命名实体识别，取得了 0.912 的微平均 F1 值，并优于多个基线模型。

arXiv:2606.10392v1 公告类型：新摘要：金融命名实体识别（NER）对于将非结构化金融报告和新闻转化为结构化知识图谱至关重要。然而，通用大语言模型（LLMs）经常错误分类金融实体或忽略领域特定模式。本文研究了使用近期开源大语言模型 DeepSeek-R1-8B，结合低秩适配（LoRA）和噪声嵌入微调（NEFTune）进行金融 NER。我们语料库中的1693个样本中，每个带标注的句子都被转换为指令-输入-输出三元组。我们在 Transformer 层中插入轻量级 LoRA 矩阵，并应用 NEFTune 通过在训练期间向嵌入向量添加均匀噪声来提高泛化能力。实验表明，LoRA 适配的 DeepSeek-R1-8B 在七种实体类型（公司、日期、地点、金额、人物、产品和数量）上取得了 0.901 的微平均 F1，而添加 NEFTune 进一步将微平均 F1 提升至 0.912，优于 Llama3-8B、Qwen3-8B、Baichuan2-7B、T5 和 BERT-Base 等基线模型。

查看原文

查看缓存全文

缓存时间: 2026/06/10 06:14

# 指令微调DeepSeek-R1-8B模型：结合LoRA与NEFTune
来源：https://arxiv.org/abs/2606.10392
查看PDF (https://arxiv.org/pdf/2606.10392)

> 摘要：金融命名实体识别（NER）对于将非结构化金融报告和新闻转化为结构化知识图谱至关重要。然而，通用大型语言模型（LLMs）常常错误分类金融实体，或忽略领域特定的模式。本文研究了将近期开源大型语言模型DeepSeek-R1-8B与低秩适配（LoRA）和噪声嵌入微调（NEFTune）相结合用于金融NER的方法。我们语料库中的1693个样本，每个已标注句子被转换为指令-输入-输出三元组。我们在Transformer层中插入轻量级LoRA矩阵，并应用NEFTune——在训练过程中向嵌入向量添加均匀噪声——以提升泛化能力。实验表明，LoRA适配的DeepSeek-R1-8B在七种实体类型（公司、日期、地点、金额、人物、产品和数量）上取得了0.901的微平均F1值，而加入NEFTune后，微平均F1值进一步提升至0.912，超越了Llama3-8B、Qwen3-8B、Baichuan2-7B、T5和BERT-Base基线模型。

## 提交历史

来自：Mingni Luo \[查看邮件 (https://arxiv.org/show-email/b0599c0c/2606.10392)\] **\[v1\]**2026年6月9日 星期二 04:14:49 UTC (493 KB)

使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 模型进行指令微调

相似文章

可以多小？LoRA微调270M-8B模型用于金融交易中的商户信息提取

超越LoRA：你能击败最流行的微调技术吗？

@DailyDoseOfDS_：在您自己的语言上微调DeepSeek-OCR！（100%本地）大多数视觉模型将文档视为巨大的序列…

DeepSeek V4 完整论文发布：FP4 QAT 技术细节与训练稳定性技巧 [D]

Hybrid-LoRA：桥接全微调与低秩适应的后训练方法

提交意见反馈