标签
介绍RusFinChain——首个面向金融领域可验证思维链推理的俄语符号基准测试,涵盖17个领域,包含5,280个参数化示例,并增强了评估指标,包括模糊数值对齐。
本文对17个紧凑型语言模型(1B-8B参数)在俄语RAG系统中作为生成器进行了基准测试,仅使用CPU推理,发现Qwen系列模型在私有、无GPU部署中提供了出色的质量-延迟权衡。