evaluation-benchmarks

标签

Cards List
#evaluation-benchmarks

测试的测试:类分割异常检测中的分数方向不稳定性

arXiv cs.LG · 2026-06-03 缓存

该论文揭示了在类分割异常检测评估中,由于表示空间中的分布重叠,异常分数可能变得不稳定甚至反转,并引入了一种无训练的邻域类泄漏诊断来预测此现象。

0 人收藏 0 人点赞
#evaluation-benchmarks

ClawGUI:用于训练、评估和部署 GUI Agent 的统一框架

Papers with Code Trending · 2026-04-13 缓存

ClawGUI 是一个开源框架,用于通过强化学习训练、评估和部署 GUI Agent,具备标准化基准测试能力,并支持跨平台部署至 Android、iOS 和 HarmonyOS。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈