evaluation-harnesses

标签

Cards List
#evaluation-harnesses

迈向评估工程:对现实环境中机器学习评估框架的实证研究

Hugging Face Daily Papers · 2026-05-22 缓存

本文对57个机器学习评估框架进行了实证研究,识别了五个工作阶段中常见的操作挑战及其根本原因,并主张将评估工程作为一个独立的软件工程关注点。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈