Ornith-1.0:用于智能体编码的自支架大语言模型

Simon Willison's Blog 模型

摘要

DeepReinforce 发布了 Ornith-1.0,这是一个基于 Gemma 4 和 Qwen 3.5 构建的开源权重、MIT 许可的大语言模型家族,在同类开源模型中取得了最先进的编码性能。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/29 18:02

# Ornith-1.0:用于智能体编程的自脚手架大语言模型 来源:https://simonwillison.net/2026/Jun/29/ornith/ 2026年6月29日 \- 链接博客 **Ornith\-1\.0: Self\-Scaffolding LLMs for Agentic Coding(https://deep-reinforce.com/ornith_1_0.html)**。这是一个有趣的开源权重(MIT 许可)新模型,也是 DeepReinforce 发布的首个模型。 > \[\.\.\.\] 变体包括 9B Dense、31B Dense、35B MoE 和 397B MoE。基于预训练的 Gemma 4 和 Qwen 3.5 构建,在编码基准测试中,它在规模相近的开源模型中达到了最先进的性能。 据我所知,这些底层模型的许可证与这种方式兼容——Gemma 4 采用 Apache 2.0 许可(且不受之前 Gemma 模型附带的繁琐附加 Gemma 使用条款(https://ai.google.dev/gemma/terms)的约束),Qwen 3.5 也采用 Apache 2.0 许可。 我一直在使用 LM Studio 和 ornith-1.0-35b-Q4_K_M.gguf(https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF)(20GB)GGUF 格式运行该模型,并连接到 Pi(https://pi.dev/)。初步印象非常好——它似乎能够熟练地在多次工具调用中运行智能体框架。 这是一个终端会话(https://gisthost.github.io/?35da4d9ce7f0c27124c67655a0dc9e5d),我在其中要求它“找到解码 actor cookie 的代码”,然后“找到点击按钮时打开插入对话框的代码”,针对一个 Datasette 检出版本,它轻松处理了。 我还让它画了这只鹈鹕(https://gist.github.com/simonw/1869e1bbcafe5bcad0f26351f6a978a6),输出速度为 103 tokens/秒: > 一只白色鹈鹕(虽然有点变形)的卡通插图,有着巨大的橙色喙,骑着红色自行车穿过绿色山丘。场景中有蓝天、黄色太阳和三朵白云,前景点缀着小草簇。 虽然有点变形,但鹈鹕显然是鹈鹕。 我找不到太多关于 DeepReinforce 本身的信息。我能找到的最早论文是 2025 年 6 月的 CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning(https://arxiv.org/abs/2507.14111)。

相似文章

Ornith-1.0:用于智能代理编码的自我构建型大语言模型

Hacker News Top

Deep Reinforce发布了Ornith-1.0系列开源自我改进大语言模型,专为智能代理编码设计,参数规模从9B到397B,在SWE-Bench Verified和Terminal-Bench 2.1等基准测试中取得了最先进的性能,超越了Claude Opus 4.7及其他领先的开源模型。

deepreinforce-ai/Ornith-1.0-35B-GGUF

Hugging Face Models Trending

deepreinforce-ai 发布了 Ornith-1.0-35B-GGUF,这是一个最先进的开源编程智能体模型,它使用自我改进的强化学习来联合优化框架和解决方案生成,在编程基准测试上达到了SOTA性能。