urdu

标签

Cards List
#urdu

Riazi-8B:一个用于数学推理的乌尔都语大语言模型

arXiv cs.CL · 昨天 缓存

Riazi-8B是一个针对数学推理微调的乌尔都语大语言模型,通过在乌尔都语思维链数据上持续预训练和监督微调,在MGSM-Urdu上实现了性能提升。

0 人收藏 0 人点赞
#urdu

UrduMMLU:乌尔都语理解的大规模多任务基准测试

arXiv cs.CL · 2026-06-08 缓存

UrduMMLU是一个新基准测试,包含来自本土教育材料的26,431道多项选择题,涵盖26个学科,用于评估大语言模型在乌尔都语理解上的表现。对30个大语言模型的评估显示,Gemini-3.5-Flash表现最佳,而开源模型和区域特定学科仍构成重大挑战。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈