Ornith-1.0:用于智能体编码的自支架大语言模型
摘要
DeepReinforce 发布了 Ornith-1.0,这是一个基于 Gemma 4 和 Qwen 3.5 构建的开源权重、MIT 许可的大语言模型家族,在同类开源模型中取得了最先进的编码性能。
暂无内容
查看缓存全文
缓存时间: 2026/06/29 18:02
# Ornith-1.0:用于智能体编程的自脚手架大语言模型
来源:https://simonwillison.net/2026/Jun/29/ornith/
2026年6月29日 \- 链接博客
**Ornith\-1\.0: Self\-Scaffolding LLMs for Agentic Coding(https://deep-reinforce.com/ornith_1_0.html)**。这是一个有趣的开源权重(MIT 许可)新模型,也是 DeepReinforce 发布的首个模型。
> \[\.\.\.\] 变体包括 9B Dense、31B Dense、35B MoE 和 397B MoE。基于预训练的 Gemma 4 和 Qwen 3.5 构建,在编码基准测试中,它在规模相近的开源模型中达到了最先进的性能。
据我所知,这些底层模型的许可证与这种方式兼容——Gemma 4 采用 Apache 2.0 许可(且不受之前 Gemma 模型附带的繁琐附加 Gemma 使用条款(https://ai.google.dev/gemma/terms)的约束),Qwen 3.5 也采用 Apache 2.0 许可。
我一直在使用 LM Studio 和 ornith-1.0-35b-Q4_K_M.gguf(https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF)(20GB)GGUF 格式运行该模型,并连接到 Pi(https://pi.dev/)。初步印象非常好——它似乎能够熟练地在多次工具调用中运行智能体框架。
这是一个终端会话(https://gisthost.github.io/?35da4d9ce7f0c27124c67655a0dc9e5d),我在其中要求它“找到解码 actor cookie 的代码”,然后“找到点击按钮时打开插入对话框的代码”,针对一个 Datasette 检出版本,它轻松处理了。
我还让它画了这只鹈鹕(https://gist.github.com/simonw/1869e1bbcafe5bcad0f26351f6a978a6),输出速度为 103 tokens/秒:
> 一只白色鹈鹕(虽然有点变形)的卡通插图,有着巨大的橙色喙,骑着红色自行车穿过绿色山丘。场景中有蓝天、黄色太阳和三朵白云,前景点缀着小草簇。
虽然有点变形,但鹈鹕显然是鹈鹕。
我找不到太多关于 DeepReinforce 本身的信息。我能找到的最早论文是 2025 年 6 月的 CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning(https://arxiv.org/abs/2507.14111)。
相似文章
Ornith-1.0:用于智能代理编码的自我构建型大语言模型
Deep Reinforce发布了Ornith-1.0系列开源自我改进大语言模型,专为智能代理编码设计,参数规模从9B到397B,在SWE-Bench Verified和Terminal-Bench 2.1等基准测试中取得了最先进的性能,超越了Claude Opus 4.7及其他领先的开源模型。
DeepReinforce 发布 Ornith-1.0 开源编程模型(2分钟阅读)
DeepReinforce 开源了 Ornith-1.0,这是一系列自我改进的编程模型,参数从 9B 到 397B 不等,基于 Gemma 4 和 Qwen 3.5 基础模型训练,采用了一种新颖的强化学习方法,能够学习生成自己的脚手架。
Ornith-1.0:用于智能体编程的自我改进开源模型
Ornith-1.0 是一系列用于智能体编程的开源自我改进模型,通过联合优化脚手架和解决方案展开的强化学习,在编程基准测试中实现了最先进的性能。
@rohanpaul_ai: 又一个精彩的开源发布。DeepReinforce刚刚发布了Ornith-1.0,一个MIT许可的开源智能编码LLM系列…
DeepReinforce发布了Ornith-1.0,这是一个MIT许可的开源智能编码LLM系列,包含一个397B MoE模型,该模型在SWE-Bench和Terminal-Bench上超越了Claude Opus 4.7,采用了新颖的自我改进训练策略。
deepreinforce-ai/Ornith-1.0-35B-GGUF
deepreinforce-ai 发布了 Ornith-1.0-35B-GGUF,这是一个最先进的开源编程智能体模型,它使用自我改进的强化学习来联合优化框架和解决方案生成,在编程基准测试上达到了SOTA性能。