performance-metrics

标签

Cards List
#performance-metrics

PlanGPT补充研究:基于定义性能指标的评估及与规划器比较

arXiv cs.AI · 4天前 缓存

本文对PlanGPT(一种用于自动规划的大型语言模型)进行了补充评估,使用了规划成本和规划生成时间指标,并发现PlanGPT的表现并不优于贪婪搜索策略。

0 人收藏 0 人点赞
#performance-metrics

eTPS 网站计划 – 简单排行榜 + 您将实际看到的内容

Reddit r/artificial · 2026-05-07

作者介绍了effectiveTPS的网站计划,这是一款使用新的'eTPS'指标(有效TPS)以及原始速度和延迟来比较本地AI模型的工具。其目标是提供一个简单的排行榜,突出展示有用的输出质量,而非原始营销数字。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈