我制作了一个离线、单文件的GPU构建选择器,用于估算一台设备能运行哪些本地模型以及以多少tok/s的速度运行

Reddit r/LocalLLaMA 工具

摘要

一位开发者创建了一个离线、单文件的GPU构建选择器,用于估算系统能运行哪些本地AI模型以及其token生成速度。

暂无内容
查看原文

相似文章