标签
Bellwethr 正在开发一种开放方法,用于追踪来自高性能模型的单个推理 token 的实际美元成本,目前基准测试套件草案和社区贡献正在进行中。
本文调研了AI在整个研究生命周期中的能力与局限,从创意生成到成果发布,识别出可靠辅助与不可靠自主之间的明确界限。它提供了一个分类体系、基准测试套件、工具清单以及人类主导的AI协作研究设计原则。