domain-specific

#domain-specific

基于领域特定知识图谱的面向旅游的推理大语言模型

arXiv cs.CL ↗ · 昨天缓存

本文提出一个模块化流水线，使用领域特定知识图谱生成多跳问答对，并微调一个面向旅游领域的推理大语言模型 (Qwen3-4B)，实现了82.4%的精确匹配准确率，显著优于基线模型。

0 人收藏 0 人点赞

#domain-specific

工具增强型LLM代理在实际能源分析任务中的表现如何？

arXiv cs.AI ↗ · 5天前缓存

本文介绍了一项实证研究和基准测试，用于评估工具增强型LLM代理在实际能源分析任务上的表现，包含243个由专家策划的问题，涵盖市场数据检索、知识解读和定量建模。

0 人收藏 0 人点赞

#domain-specific

在领域特定任务上，使用约3美元的API调用和零人工标注，将Qwen2.5-7B微调至Claude Haiku的96%性能

Reddit r/LocalLLaMA ↗ · 2026-06-10

提出DV-DPO方法，仅用约3美元的API调用和零人工标注，即可在领域特定任务上微调Qwen2.5-7B，通过对抗性交叉检验达到Claude Haiku综合性能的96%。

0 人收藏 0 人点赞

#domain-specific

词与道：面向德国医学自然语言处理的领域特定BERT预训练策略

arXiv cs.CL ↗ · 2026-06-03 缓存

本文介绍了ChristBERT，一个基于RoBERTa的面向德国临床NLP的领域特定语言模型家族，并在医学命名实体识别和文本分类任务上评估了三种领域适应策略（继续预训练、从头预训练和词汇适应），取得了最先进的结果。

0 人收藏 0 人点赞

#domain-specific

知识卸载：将大语言模型分解为稀疏骨干网络与记忆模块

arXiv cs.LG ↗ · 2026-05-29 缓存

提出KOFF框架，利用结构化剪枝和LoRA适配器将预训练大语言模型分解为稀疏共享骨干网络与领域特定外部记忆，实现12%稀疏度且无明显性能损失。

0 人收藏 0 人点赞

#domain-specific

MechVQA: 在全面机械图纸理解中对多模态LLM进行基准测试与增强

Hugging Face Daily Papers ↗ · 2026-05-29 缓存

本文介绍了MechVQA，一个包含3.3k高密度机械工程图纸和21k问答对的数据集，以及MechVL模型，该模型在MechVQA总分上优于现有基线7.57个百分点，推动了多模态LLM对机械图纸的理解。

0 人收藏 0 人点赞

#domain-specific

通过最小充分表示学习实现的大语言模型领域特定数据合成

Hugging Face Daily Papers ↗ · 2026-05-29 缓存

DOMINO 是一个新颖的框架，它从参考示例中学习最小充分的领域表示，为LLMs合成领域特定数据，从而在不要求显式领域描述的情况下提升代码基准性能。

0 人收藏 0 人点赞

#domain-specific

MULTISEISMO：多模态地震数据集与模型，用于跨模态地震理解

arXiv cs.LG ↗ · 2026-05-27 缓存

本文介绍了MultiSeismo，一个大规模多模态地震数据集，包含超过16,000个事件，整合了波形、烈度图和元数据，以及MISCE指令集和SeisModal——一个经过微调的多模态模型，用于跨模态地震理解。

0 人收藏 0 人点赞

#domain-specific

FAB-Bench：面向半导体制造的自适应RAG基准评估框架

arXiv cs.CL ↗ · 2026-05-27 缓存

FAB-Bench是一个用于评估半导体制造中检索增强生成（RAG）系统的基准框架，包含六项诊断指标和跨上下文窗口的分析。它提供了200个精选的问答对，并揭示了上下文缩放行为和注意力稀释问题。

0 人收藏 0 人点赞

#domain-specific

Palette：一种模块化、可控且高效的大语言模型按需授权安全对齐放松框架

arXiv cs.AI ↗ · 2026-05-26 缓存

Palette提出了一种模块化框架，用于在授权的专业领域中选择性地放松大语言模型的安全拒绝行为，利用多目标搜索和轻量级适配来避免昂贵的重新训练。

0 人收藏 0 人点赞

#domain-specific

自主代理搜索模型（5分钟阅读）

TLDR AI ↗ · 2026-05-13 缓存

自主代理搜索模型是专门为编排搜索任务而训练的LLM，相比GPT-5等通用模型，它们提供更小、更快且领域特定的替代方案。这些模型通过让智能模型管理整个检索过程，解构了传统的单体搜索栈。

0 人收藏 0 人点赞

#domain-specific

BAGEL：语言模型中的动物知识专业性基准评估

arXiv cs.CL ↗ · 2026-04-20 缓存

BAGEL是一个用于评估大语言模型中与动物相关知识的新基准，从多种科学资源构建，涵盖分类学、形态学、栖息地、行为和物种相互作用等方面，通过闭卷问答对形式呈现。该基准可以进行跨分类群和知识类别的细粒度分析，为生物多样性应用中的模型优势和失败模式提供洞见。

0 人收藏 0 人点赞

domain-specific

提交意见反馈