构建 Qwen 3.6 - Codex 桥梁:进一步进展与现实现状检查
摘要
作者更新了自定义的适配器和 UI 桥接工具,以便通过 llama.cpp 在本地 RTX 5090 上运行 Qwen 3.6 模型,从而在 GitHub Copilot Codex 中使用。本文详细介绍了已实现的功能、修复的 Bug 以及在实现与原生 OpenAI 模型等效性方面仍存在的局限性。
我在为在 Codex 上运行 Qwen 3.6 模型而开发的适配器方面取得了一些进展。在测试、分析和构建该适配器的过程中,我将 TBG(O)llama-swap 演变为一个完整的取证 UI 桥接和 LLM 分析工具,其中适配器的每一次发现、修改、纠正、工具调用、推理步骤和执行流程都完全可见。这种透明度对于识别原生 OpenAI 模型与 Qwen 3.6 之间的行为差异,并据此微调适配器是必要的。视频展示了在单张 NVIDIA GeForce RTX 5090 上运行 Qwen 3.6 的完整 Codex 运行过程。(Codex in VS Code -> tbg(o)llama-swap -> llama.cpp with qwen 3.6 27B)持续的工作可以在这里查看:[https://github.com/Ltamann/tbg-ollama-swap-prompt-optimizer/tree/qwen3.6](https://github.com/Ltamann/tbg-ollama-swap-prompt-optimizer/tree/qwen3.6) ,[第一篇帖子](https://www.patreon.com/posts/building-bridge-157050652) ,[第二篇帖子](https://www.patreon.com/posts/building-bridge-158134849?utm_medium=clipboard_copy&utm_source=copyLink&utm_campaign=postshare_creator&utm_content=join_link) 以下是目前最清晰的状态。
**工作正常**
* `apply_patch`
* `apply_patch` 创建/更新/删除流程
* `create_file` 需要非空的 `diff` 或 `content`
* `update_file` 需要非空的 `diff` 或 `content`
* `delete_file` 无需 `diff` 即可工作
* `shell`
* `web_search`
* `web_search` 使用 TBG(O)llama-swap 内置的网络搜索
* `file_search`
* `view_image`
* `request_user_input`
* `update_plan`
* `spawn_agent`
* `wait_agent`
* `send_input`
* `resume_agent`
* `close_agent`
* `supports_search_tool` 目录不一致
* `agent_send_input_roundtrip`
* `agent_subagent_same_model`
* `shell_patch_verify_sequence`
* `web_research_then_notes`
* `plan_act_switch_impl`
* `multi_web_patch_verify`
* `skill_create_and_use_local`
* `workspace_summary_then_plan`
* `skill_read_local`
* `direct_plan_no_web`
* `web_research_then_plan`
* `file_search_then_patch`
* `view_image_then_report`
* 无效 `apply_patch` 重试耗尽后不再以虚假的进度描述结束
* 在 `apply_patch` 损坏后具有更安全的恢复分支
* 从指令中提取错误的 patch-intent/path-hint
* 由于上游采用不健康或重复导致的重连 Bug
* 长延迟 `502` 超时路径缩短并得到改进
* 原生 vs 本地对比适配器:
* `init`
* `compare`
* 每个场景的 `comparison.json`
* 顶层 `comparison_summary.json`
* 工具表面差异
* 项目类型差异
* 流/补全差异
* 最终可见文本差异
* 分组的 UX 摘要差异
**在桥接合约中实现**
* 更严格分离:
* 可见的助手文本
* 工具调用项
* 工具输出
* 文件/代码工件
* 显式的连续状态处理:
* 研究流程
* 写入等待流程
* 验证流程
* 最终答案移交
**已修复到可以工作,但尚未达到原生完美**
* 分组搜索
* 分组工具调用
* 分组文件更改
* 可折叠的内部历史记录
这些领域在 UI 和适配器方面都有显著改进,但我仍会将它们描述为*部分对齐*,尚未完全实现原生一致性。
**已修复**
* `mcp__playwright__browser_navigate`
* `mcp__playwright__browser_snapshot`
* `mcp__playwright__browser_click`
* `mcp__playwright__browser_evaluate`
* `mcp__playwright__browser_resize`
* `mcp__playwright__browser_take_screenshot`
重要的细微差别:
* llama-swap 现在更准确地保留和暴露这些内容
* 然而,WSL Codex 路由器仍然拒绝 Playwright 叶子调用,因为它们在该表面上不受支持
* 这现在被跟踪为一个已知的局限性,而不是活跃的 llama-swap 桥接 Bug
**仍未完全解决 / 需要更多工作**
* 完整的原生风格分组工作者 UX 等效性
* 在长多步运行期间存在的一些剩余模型质量怪癖
* 围绕格式错误的推理/文本分割的连续/报告润色
相似文章
在github-copilot、pi、claude-code和opencode中使用Qwen3.6 27B完成相同任务
作者使用相同的 Qwen3.6 27B 模型测试了多个编码代理框架(GitHub Copilot、Pi、Claude Code、OpenCode),发现框架设计对性能影响显著,其中 OpenCode 在网络搜索和 Web 开发方面表现出色,而 GitHub Copilot 在文件编辑工具方面表现不佳。
Qwen/Qwen3.6-27B
Qwen 在 Hugging Face 上发布了开源权重模型 Qwen3.6-27B,该模型具备更高的稳定性、强大的智能体编程能力以及思维链保留特性,有助于提升开发者的工作效率。
Qwen 3.7 Max
Qwen 3.7 是一款来自中国实验室的新AI模型,令人印象深刻,讨论焦点在于其权重是否可供下载。
Qwen3.6-27B-GGUF 重磅发布!
社区 GGUF 版本上线,Qwen 27B 混合架构模型支持 262K 上下文、多模态输入、工具调用,并保留“思考过程”,专为智能体编程而生。
等待 Qwen 3.7 开源权重… 新王者已至…
Qwen 3.7 开源权重模型已发布,在 AI 社区中引起巨大轰动,成为全新的顶级模型。