标签
阿里巴巴在 Arena 上发布了 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview,在文本和视觉类别中均取得顶级排名。
介绍了 MulTaBench,一个包含40个数据集的基准测试,用于文本和图像模态的多模态表格学习。实验表明,任务特定的嵌入调优优于冻结的预训练嵌入,特别是在模态提供互补预测信号时。