mtmm-framework

标签

Cards List
#mtmm-framework

能力的坐标系:用于大语言模型评估的统一MTMM几何框架

arXiv cs.CL · 6天前 缓存

这篇知识系统化论文提出了一种用于评估大语言模型的统一多特质多方法(MTMM)几何框架,将不同的指标整合到一个共享的潜在坐标空间中,以解决当前基准测试中的构念效度问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈