bloom-taxonomy

标签

Cards List
#bloom-taxonomy

跨数据集布卢姆问题分类:监督模型与提示大语言模型

arXiv cs.CL · 2026-06-15 缓存

本文评估了监督机器学习/深度学习模型和提示大语言模型在自动进行布卢姆分类学试题分类时的跨数据集泛化能力,发现大语言模型在不同教育背景下具有更强的鲁棒性。

0 人收藏 0 人点赞
#bloom-taxonomy

Almieyar-Oryx-BloomBench:一种用于认知驱动评估视觉语言模型的双语多模态基准

Hugging Face Daily Papers · 2026-06-04 缓存

BloomBench是一个基于认知理论的双语(英语-阿拉伯语)多模态视觉语言模型基准,系统评估基于布鲁姆分类学的六个认知层次。实验揭示了当前模型中显著的认知不对称和跨语言性能差距。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈