标签
本文提出了一个阿拉伯语-俄语科学翻译的基准,包括一个包含27,000个句对的混合平行语料库,以及使用LoRA微调的多语言模型(mT5、NLLB、Qwen)。最佳模型达到了BLEU分数23.15,该工作旨在降低阿拉伯语和俄语研究人员之间科学知识交流的语言障碍。
Arch Linux AUR 中的恶意软件包被发现向用户的 shell 配置文件中插入俄语垃圾信息,促使维护者进行清理。
本文介绍了一个包含来自哈萨克斯坦的10万多条电影评论的多语言数据集,涵盖俄语、哈萨克语以及语码转换文本。论文针对情感极性分类和评分分类任务,对经典模型和基于Transformer的模型进行了基准测试。