few-shot

标签

Cards List
#few-shot

从演示到奖励:VLM奖励模型的测试时提示优化

arXiv cs.LG · 昨天 缓存

提出Demo2Reward,一种针对VLM奖励模型的测试时提示优化技术,利用少量专家演示,显著减少误报,并在无需额外模型训练的情况下改进机器人策略学习。

0 人收藏 0 人点赞
#few-shot

从结构化临床数据预测心血管风险的大语言模型

arXiv cs.CL · 昨天 缓存

本文提出了一种混合框架,将结构化临床数据与LLM生成的叙述相结合,用于冠状动脉疾病预测,在变量提取方面实现了高保真度,并比较了机器学习模型与基于LLM的零样本和少样本分类。

0 人收藏 0 人点赞
#few-shot

GraphARC:基于图结构的抽象推理综合基准

arXiv cs.AI · 2天前 缓存

GraphARC是一个针对图结构数据抽象推理的新基准,将ARC范式扩展到图领域。对最新语言模型的评估揭示了理解与执行之间的差距,且在大规模实例上性能下降,凸显了扩展挑战。

0 人收藏 0 人点赞
#few-shot

ACIL: 用于上下文学习的自动Chain-of-Thought

arXiv cs.CL · 2026-05-19 缓存

本文介绍了ACIL,一种自动Chain-of-Thought框架,通过生成和修剪推理链来增强上下文学习,从而提升LLM在复杂任务上的表现。

0 人收藏 0 人点赞
#few-shot

面向在线患者咨询的可操作分诊分类的小样本大语言模型

arXiv cs.CL · 2026-05-18 缓存

本文探讨了使用小样本提示的大语言模型对在线患者咨询进行可操作分诊分类,分为自我护理、预约就诊、紧急临床审查或急诊转诊。最佳模型(Claude Haiku 4.5,12次小样本提示)的macro-F1达到0.475,超过了有监督基线,但作者得出结论:LLMs可以支持分诊优先级排序和选择性人工审核,但不能自主部署。

0 人收藏 0 人点赞
#few-shot

FFAvatar: 少样本、前馈、可泛化的头像重建

Hugging Face Daily Papers · 2026-05-14 缓存

FFAvatar提出了一种前馈框架,能在数秒内从少量非摆拍图像中重建高质量、可动画的3D高斯头部头像,在NeRSemble基准测试上相比现有最优方法实现了5.5 PSNR的提升。

0 人收藏 0 人点赞
#few-shot

通过随机选择的少样本指导提升基于可验证奖励的强化学习

Hugging Face Daily Papers · 2026-05-14 缓存

FEST是一种少样本演示引导的强化学习算法,通过结合监督信号、在线策略学习和加权训练以防止过拟合,仅需极少的监督微调数据即可实现强劲性能。

0 人收藏 0 人点赞
#few-shot

Meta-Tool:小语言模型的高效少样本工具适配

arXiv cs.CL · 2026-04-23 缓存

独立研究表明,在 3B Llama 的工具使用中,227M 参数的超网络相比精心设计的少样本提示毫无增益,仅用 1/10 延迟即可达到 GPT-5 性能的 79.7%。

0 人收藏 0 人点赞
#few-shot

FSPO:少样本合成偏好优化实现面向真实用户的个性化

arXiv cs.CL · 2026-04-20 缓存

FSPO提出了一种用于大语言模型个性化的少样本偏好优化算法,该算法将奖励建模重新定义为元学习,使模型能够从有限的用户偏好中快速推断出个性化的奖励函数。该方法通过精心构建合成偏好数据集,在合成用户上实现了87%的个性化性能,在真实用户上实现了70%的个性化性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈