标签
本文研究了斯里兰卡旅游评论中星级评分与文本情感不一致的行为驱动因素,发现18.6%的评论存在错配,并呈现六种方向模式,同时指出场所类型、评论者专业水平和时间因素是其影响因素。
本文介绍了偏好差值聚合(PDA)和几何对齐合并(GAM),通过LoRA合并将来自弱模型对的多个“弱”偏好信号进行聚合,在知识推理和智能体搜索任务上平均将强LLM的性能提升超过6%。
本文介绍了 LogMILP,这是一种用于日志实例异常定位的弱监督框架,它利用原型引导的结构建模和反事实扰动一致性正则化,仅使用包级标签即可提高检测精度和可解释性。
本文提出了一种两阶段的神经符号框架,利用弱监督(仅需 1% 的标签)结合基于 Slot 的变分自编码器(VAE),学习用于以对象为中心的视觉推理的可解释符号,在领域泛化方面优于基础模型。
# 论文页面 - 大语言模型何时能在弱监督下学会推理? 来源:[https://huggingface.co/papers/2604.18574](https://huggingface.co/papers/2604.18574) ## 摘要 研究表明,在弱监督下的推理任务中,模型泛化能力取决于奖励饱和动态和推理忠实度,而对显式轨迹进行监督微调对于成功适应至关重要。大语言模型通过[reinfor
OpenAI的Superalignment团队介绍了弱到强的泛化,这是一个新的研究方向,用于通过解决能力较弱的人类监督者如何可靠地控制和引导智能远超自身的AI系统这一根本性问题,来实证对齐超人类AI模型。
本文介绍了“Vokenization”,这是一种多模态学习技术,通过利用弱监督将视觉数据与语言标记联系起来,从而架起计算机视觉与自然语言处理之间的桥梁。文章将其与 GPT-3 和 BERT 等纯文本模型进行了对比,强调了视觉定位如何提升语言理解能力。