@SlimTradeyBaby: 所有8-12GB GPU用户注意！这款全新的Ornith-1.0-9B看起来将成为小显存配置的强劲选手…

X AI KOLs Timeline 2026/06/26 12:30 模型

small-vram coding-benchmark 9b-model agentic-coding gguf

摘要

Ornith-1.0-9B是一款新的90亿参数AI模型，针对8-12GB GPU进行了优化，在智能体编码基准测试中表现出色，性能与大小为其2-3倍的模型相当甚至超越。

所有8-12GB GPU用户注意！这款全新的Ornith-1.0-9B看起来将成为小显存配置的强劲选手。它在智能体编码基准测试中表现远超其规模，击败或媲美大小为其2-3倍的模型。完整GGUF量化版本将在评论区发布 ⬇️ https://t.co/N5iC6PrRv5

查看原文

查看缓存全文

缓存时间: 2026/06/27 09:53

所有8-12GB GPU用户请注意！

这款全新的Ornith-1.0-9B模型，看起来将成为小显存配置中的一匹强劲黑马。在代理编码基准测试中，它展现了远超自身规模的实力——不仅表现惊艳，甚至能匹敌或超越2-3倍于其体量的模型。

完整GGUF量化版本已发布在评论区⬇️ https://t.co/N5iC6PrRv5

相似文章

Reddit r/LocalLLaMA

Ornith-1.0-35B Q3_K_M是一个35B参数模型的3位量化版本，需要约17 GB显存，并通过KLD与BF16对比检查以确保保真度。

X AI KOLs Timeline

DeepReinforce AI 发布了 Ornith-1.0，这是一个自优化的开源模型系列，专为智能代理编码而设计，包含一个 35B MoE 变体，在编码基准测试中达到了最先进的性能，并能在 5090 等单 GPU 上高效运行。

X AI KOLs Following

Ornith-1.0 是一系列专注于智能体编码的开源 LLM，参数范围从 9B 到 397B，在同等规模的开源模型中达到了最先进的性能。

Reddit r/LocalLLaMA

Ornith-1.0-35B GGUF 模型更新引入了原生 MTP 推测解码嫁接，可在单 GPU 上实现更快推理，解码速度提升约 1.3-1.35 倍，同时保持几乎相同的 token 分布。提供了多个量化版本的吞吐量、TTFT 和长上下文性能的基准数据。

X AI KOLs Timeline

宣布Ornith-1.0-35B，一个Qwen3.6-35B-A3B的编码微调版本，在aider基准测试上略优于基础模型。同时推广用于在RTX 3090上运行LLM的club-3090仓库。