visual-language-models

标签

Cards List
#visual-language-models

工业场景中的零样本学习:新的大规模基准、挑战与基线

arXiv cs.AI · 2026-06-09 缓存

本文提出了一个用于零样本工业缺陷检测的大规模多模态数据集(MMIO),并介绍了改进文本-视觉提示(RTVP)方法,在该基准上取得了最优结果。

0 人收藏 0 人点赞
#visual-language-models

从数据到洞察:探索程序思维提示在图表摘要中的应用

arXiv cs.CL · 2026-05-29 缓存

本文介绍了一种基于程序思维提示(Program-of-Thoughts prompting)的零样本图表摘要策略,其中轻量级视觉语言模型(VLMs)生成Python程序来计算统计数据,从而在事实准确性上优于现有方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈