Ornith-1.0-35B Q3_K_M:约17 GB显存,经KLD与BF16对比验证

Reddit r/LocalLLaMA 模型

摘要

Ornith-1.0-35B Q3_K_M是一个35B参数模型的3位量化版本,需要约17 GB显存,并通过KLD与BF16对比检查以确保保真度。

暂无内容
查看原文

相似文章

Ornith-1.0 在 Hugging Face 上发布

Reddit r/LocalLLaMA

Ornith-1.0 已在 Hugging Face 上发布,包含一系列模型,参数范围从 9B 到 397B,涵盖密集和 MoE 架构,声称在各项基准测试中达到 SOTA 性能。