retrieval-augmented

标签

Cards List
#retrieval-augmented

在内存基准测试LongMemEval上以Gemini Flash(非Pro)取得第一 [R]

Reddit r/MachineLearning · 昨天

一个受情景记忆理论启发的新型内存检索系统,使用Gemini Flash在LongMemEval基准测试中取得了最先进的96.4% top-50准确率,通过将检索质量与模型能力分离,超越了基于Pro的大型基线。

0 人收藏 0 人点赞
#retrieval-augmented

当证据冲突时:检索增强生物医学问答中的不确定性与顺序效应

arXiv cs.CL · 4天前 缓存

本文在冲突证据条件下评估了六个开放权重的大语言模型在生物医学问答中的表现,揭示了准确率下降和预测翻转,并提出了一个冲突感知的弃权评分,提高了选择性准确率。

0 人收藏 0 人点赞
#retrieval-augmented

EviMem: 证据差距驱动的迭代检索用于长期对话记忆

Hugging Face Daily Papers · 2026-04-30 缓存

EviMem结合了用于证据差距检测的IRIS和用于分层记忆的LaceMem,以改进长期对话记忆检索,在时间和多跳问题上实现了更高准确率和更低延迟。

0 人收藏 0 人点赞
#retrieval-augmented

CoAuthorAI:面向科学书籍写作的人类参与系统

arXiv cs.CL · 2026-04-23 缓存

CoAuthorAI 是一种人类参与系统,融合检索增强生成与层级大纲,实现准确连贯的科学书籍写作,在评测中达到 98% 召回率和 82% 用户满意度。

0 人收藏 0 人点赞
#retrieval-augmented

通过检索增强大型语言模型提升金融情感分析

Papers with Code Trending · 2023-10-06 缓存

本文介绍了一种检索增强的大型语言模型框架用于金融情感分析,相比传统模型及ChatGPT、LLaMA等大型语言模型,在准确率和F1分数上实现了15%至48%的提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈