标签
提出面向GUI定位的质量感知自蒸馏方法,通过正确性感知门控和概率缩放改进坐标-标记教师信号,以提升视觉语言模型性能。
本文介绍了BlendIn,一个推理时对齐框架,它使用概率模型融合来评估指导可靠性并按比例加权模型贡献,通过避免有害干预实现了高达50%的性能提升。