urdu

#urdu

Riazi-8B: An Urdu Large Language Model for Mathematical Reasoning

arXiv cs.CL ↗ · yesterday Cached

Riazi-8B is an Urdu large language model fine-tuned for mathematical reasoning, achieving improved performance on MGSM-Urdu through continued pre-training and supervised fine-tuning on Urdu Chain-of-Thought data.

0 favorites 0 likes

#urdu

UrduMMLU: A Massive Multitask Benchmark for Urdu Language Understanding

arXiv cs.CL ↗ · 2026-06-08 Cached

UrduMMLU is a new benchmark of 26,431 multiple-choice questions across 26 subjects for evaluating LLMs on Urdu language understanding, sourced from native educational materials. Evaluation of 30 LLMs reveals Gemini-3.5-Flash performs best, while open-source models and region-specific subjects pose significant challenges.

0 favorites 0 likes

urdu

Riazi-8B: An Urdu Large Language Model for Mathematical Reasoning

UrduMMLU: A Massive Multitask Benchmark for Urdu Language Understanding

Submit Feedback