@LLMenjoyerUK:是的,我们的Open MM-RL数据集在@huggingface上登顶第一。它有何不同:-它其实很难…

X AI KOLs Following 工具

摘要

Open MM-RL数据集在Hugging Face登顶第一,提供博士级别的STEM问题,采用确定性评分用于多模态强化学习训练,包含经领域专家双重审核的复杂视觉任务。

没错,我们的Open MM-RL数据集在@huggingface上登顶第一。它有何不同: -它其实很难:这些是涵盖物理、化学、生物和数学的博士级STEM问题。 -零“凭感觉”评分:100%的答案是确定且可自动验证的。 -复杂度分级:我们包含了单图、多面板图和多图任务。这让你能精确定位模型在视觉分布复杂时推理链在何处断裂。 -每个提示都经过博士领域专家双重审核,确保无歧义且不易直接查找到。 如果你在训练前沿模型或进行强化学习,这就是你一直在寻找的压力测试,另外还有3000个OTS任务即将推出。
查看原文

相似文章