@SlimTradeyBaby: 所有8-12GB GPU用户注意!这款全新的Ornith-1.0-9B看起来将成为小显存配置的强劲选手…
摘要
Ornith-1.0-9B是一款新的90亿参数AI模型,针对8-12GB GPU进行了优化,在智能体编码基准测试中表现出色,性能与大小为其2-3倍的模型相当甚至超越。
查看缓存全文
缓存时间: 2026/06/27 09:53
所有8-12GB GPU用户请注意!
这款全新的Ornith-1.0-9B模型,看起来将成为小显存配置中的一匹强劲黑马。在代理编码基准测试中,它展现了远超自身规模的实力——不仅表现惊艳,甚至能匹敌或超越2-3倍于其体量的模型。
完整GGUF量化版本已发布在评论区⬇️ https://t.co/N5iC6PrRv5
相似文章
Ornith-1.0-35B Q3_K_M:约17 GB显存,经KLD与BF16对比验证
Ornith-1.0-35B Q3_K_M是一个35B参数模型的3位量化版本,需要约17 GB显存,并通过KLD与BF16对比检查以确保保真度。
@SlimTradeyBaby: 刚刚远程启动了 Ornith 35B Q4 在 5090 上…… 2329 prompt / 195 gen tok/s,在 32k 下稳定运行。快速测试仅...
DeepReinforce AI 发布了 Ornith-1.0,这是一个自优化的开源模型系列,专为智能代理编码而设计,包含一个 35B MoE 变体,在编码基准测试中达到了最先进的性能,并能在 5090 等单 GPU 上高效运行。
@anvie:测试了 Ornith-1.0-9B,对于这种规模的模型来说,它令人印象深刻。我不相信这只是一个 9B 模型!
Ornith-1.0 是一系列专注于智能体编码的开源 LLM,参数范围从 9B 到 397B,在同等规模的开源模型中达到了最先进的性能。
Ornith-1.0-35B GGUF 更新:原生 MTP 推测解码嫁接 + 完整服务/TTFT/长上下文数据(llama.cpp, tp=1)
Ornith-1.0-35B GGUF 模型更新引入了原生 MTP 推测解码嫁接,可在单 GPU 上实现更快推理,解码速度提升约 1.3-1.35 倍,同时保持几乎相同的 token 分布。提供了多个量化版本的吞吐量、TTFT 和长上下文性能的基准数据。
@malikwas1f: Ornith-1.0-35B:一个Qwen3.6-35B-A3B的编码微调版本,在真实编码上略优于基础模型(aider 15/30 vs 13)——完整262K…
宣布Ornith-1.0-35B,一个Qwen3.6-35B-A3B的编码微调版本,在aider基准测试上略优于基础模型。同时推广用于在RTX 3090上运行LLM的club-3090仓库。