构建 Qwen 3.6 - Codex 桥梁：进一步进展与现实现状检查

Reddit r/LocalLLaMA 2026/05/13 09:59 工具

open-source llm-harness qwen github-copilot-codex local-llm developer-tools

摘要

作者更新了自定义的适配器和 UI 桥接工具，以便通过 llama.cpp 在本地 RTX 5090 上运行 Qwen 3.6 模型，从而在 GitHub Copilot Codex 中使用。本文详细介绍了已实现的功能、修复的 Bug 以及在实现与原生 OpenAI 模型等效性方面仍存在的局限性。

我在为在 Codex 上运行 Qwen 3.6 模型而开发的适配器方面取得了一些进展。在测试、分析和构建该适配器的过程中，我将 TBG(O)llama-swap 演变为一个完整的取证 UI 桥接和 LLM 分析工具，其中适配器的每一次发现、修改、纠正、工具调用、推理步骤和执行流程都完全可见。这种透明度对于识别原生 OpenAI 模型与 Qwen 3.6 之间的行为差异，并据此微调适配器是必要的。视频展示了在单张 NVIDIA GeForce RTX 5090 上运行 Qwen 3.6 的完整 Codex 运行过程。（Codex in VS Code -> tbg(o)llama-swap -> llama.cpp with qwen 3.6 27B）持续的工作可以在这里查看：[https://github.com/Ltamann/tbg-ollama-swap-prompt-optimizer/tree/qwen3.6](https://github.com/Ltamann/tbg-ollama-swap-prompt-optimizer/tree/qwen3.6) ，[第一篇帖子](https://www.patreon.com/posts/building-bridge-157050652) ，[第二篇帖子](https://www.patreon.com/posts/building-bridge-158134849?utm_medium=clipboard_copy&utm_source=copyLink&utm_campaign=postshare_creator&utm_content=join_link) 以下是目前最清晰的状态。 **工作正常** * `apply_patch` * `apply_patch` 创建/更新/删除流程 * `create_file` 需要非空的 `diff` 或 `content` * `update_file` 需要非空的 `diff` 或 `content` * `delete_file` 无需 `diff` 即可工作 * `shell` * `web_search` * `web_search` 使用 TBG(O)llama-swap 内置的网络搜索 * `file_search` * `view_image` * `request_user_input` * `update_plan` * `spawn_agent` * `wait_agent` * `send_input` * `resume_agent` * `close_agent` * `supports_search_tool` 目录不一致 * `agent_send_input_roundtrip` * `agent_subagent_same_model` * `shell_patch_verify_sequence` * `web_research_then_notes` * `plan_act_switch_impl` * `multi_web_patch_verify` * `skill_create_and_use_local` * `workspace_summary_then_plan` * `skill_read_local` * `direct_plan_no_web` * `web_research_then_plan` * `file_search_then_patch` * `view_image_then_report` * 无效 `apply_patch` 重试耗尽后不再以虚假的进度描述结束 * 在 `apply_patch` 损坏后具有更安全的恢复分支 * 从指令中提取错误的 patch-intent/path-hint * 由于上游采用不健康或重复导致的重连 Bug * 长延迟 `502` 超时路径缩短并得到改进 * 原生 vs 本地对比适配器： * `init` * `compare` * 每个场景的 `comparison.json` * 顶层 `comparison_summary.json` * 工具表面差异 * 项目类型差异 * 流/补全差异 * 最终可见文本差异 * 分组的 UX 摘要差异 **在桥接合约中实现** * 更严格分离： * 可见的助手文本 * 工具调用项 * 工具输出 * 文件/代码工件 * 显式的连续状态处理： * 研究流程 * 写入等待流程 * 验证流程 * 最终答案移交 **已修复到可以工作，但尚未达到原生完美** * 分组搜索 * 分组工具调用 * 分组文件更改 * 可折叠的内部历史记录这些领域在 UI 和适配器方面都有显著改进，但我仍会将它们描述为*部分对齐*，尚未完全实现原生一致性。 **已修复** * `mcp__playwright__browser_navigate` * `mcp__playwright__browser_snapshot` * `mcp__playwright__browser_click` * `mcp__playwright__browser_evaluate` * `mcp__playwright__browser_resize` * `mcp__playwright__browser_take_screenshot` 重要的细微差别： * llama-swap 现在更准确地保留和暴露这些内容 * 然而，WSL Codex 路由器仍然拒绝 Playwright 叶子调用，因为它们在该表面上不受支持 * 这现在被跟踪为一个已知的局限性，而不是活跃的 llama-swap 桥接 Bug **仍未完全解决 / 需要更多工作** * 完整的原生风格分组工作者 UX 等效性 * 在长多步运行期间存在的一些剩余模型质量怪癖 * 围绕格式错误的推理/文本分割的连续/报告润色

查看原文

构建 Qwen 3.6 - Codex 桥梁：进一步进展与现实现状检查

相似文章

在github-copilot、pi、claude-code和opencode中使用Qwen3.6 27B完成相同任务

Qwen/Qwen3.6-27B

Qwen 3.7 Max

Qwen3.6-27B-GGUF 重磅发布！

等待 Qwen 3.7 开源权重… 新王者已至…

提交意见反馈