标签
ModTGCN是一种模块化感知的图神经网络,通过联合优化交叉熵和基于模块化的辅助目标,利用文档图中的全局社区结构来改进文本分类,在五个基准测试上实现了持续的增益。
DeepRHP是一种混合变分自编码器,能够指导随机杂聚物作为蛋白质模拟物的设计,并通过稳定非天然环境中的膜蛋白(如Aquaporin Z)得到了验证。
FedRAN是一种资源感知的分析型联邦持续学习框架,用紧凑的随机特征统计量替代基于梯度的更新,在显著降低通信与计算成本的同时实现高精度。
本文提出了一种用于医学图像分割的质量引导半监督学习框架,该框架训练一个专用预测器,从图像-掩膜对中估计分割质量,从而提高伪标签的可靠性,并在多个数据集和架构上取得了最先进的结果。
本文介绍了半监督噪声自适应(SSNA),一种新颖的框架,它利用合成噪声域(例如高斯分布)作为替代源域,以提高半监督学习设置中的泛化能力。所提出的噪声自适应框架(NAF)建立了一个泛化边界,并展示了改进的目标域性能。
SemiPrune 是一种标签高效的数据集剪枝框架,它利用半监督学习从少量标注子集中生成伪标签,使得现有的监督剪枝方法能够处理未标注数据。在领域特定、图像损坏和长尾数据集上,它达到了最先进的性能。
本文介绍了传导锐化(TS),一种用于半监督节点分类的损失级修改,它最小化无标签节点上的预测熵,同时平衡有标签节点的效果,在不改变架构的情况下实现一致的性能提升。
本文识别了置信度门控下表格数据公平半监督学习中的结构性失效模式,并提出了在线原始-对偶分配(OPDA)来缓解这些问题,无需针对每个数据集进行调参。
本文对利用大型语言模型(LLM)引导的半监督学习进行社交媒体危机数据分类进行了实证评估。研究表明,在低资源场景下,LG-CoTrain 的表现优于经典基线模型,并突显了将 LLM 知识迁移至更小、更易部署的模型以支持灾害响应的潜力。
OpenAI 提出了 PATE(Private Aggregation of Teacher Ensembles),这是一种隐私保护方法,通过在多个教师模型的噪声输出上训练学生模型,这些教师模型在互不相交的数据集上进行训练,在不暴露敏感训练数据的情况下提供强大的差分隐私保证。
本文提出了针对文本分类的对抗训练和虚拟对抗训练方法,通过在RNN中对词嵌入而非原始输入施加扰动来实现。该方法在半监督和监督文本分类基准上取得了最先进的结果,同时降低了过拟合。