构建 Qwen 3.6 - Codex 桥梁:进一步进展与现实现状检查

Reddit r/LocalLLaMA 工具

摘要

作者更新了自定义的适配器和 UI 桥接工具,以便通过 llama.cpp 在本地 RTX 5090 上运行 Qwen 3.6 模型,从而在 GitHub Copilot Codex 中使用。本文详细介绍了已实现的功能、修复的 Bug 以及在实现与原生 OpenAI 模型等效性方面仍存在的局限性。

我在为在 Codex 上运行 Qwen 3.6 模型而开发的适配器方面取得了一些进展。在测试、分析和构建该适配器的过程中,我将 TBG(O)llama-swap 演变为一个完整的取证 UI 桥接和 LLM 分析工具,其中适配器的每一次发现、修改、纠正、工具调用、推理步骤和执行流程都完全可见。这种透明度对于识别原生 OpenAI 模型与 Qwen 3.6 之间的行为差异,并据此微调适配器是必要的。视频展示了在单张 NVIDIA GeForce RTX 5090 上运行 Qwen 3.6 的完整 Codex 运行过程。(Codex in VS Code -> tbg(o)llama-swap -> llama.cpp with qwen 3.6 27B)持续的工作可以在这里查看:[https://github.com/Ltamann/tbg-ollama-swap-prompt-optimizer/tree/qwen3.6](https://github.com/Ltamann/tbg-ollama-swap-prompt-optimizer/tree/qwen3.6) ,[第一篇帖子](https://www.patreon.com/posts/building-bridge-157050652) ,[第二篇帖子](https://www.patreon.com/posts/building-bridge-158134849?utm_medium=clipboard_copy&utm_source=copyLink&utm_campaign=postshare_creator&utm_content=join_link) 以下是目前最清晰的状态。 **工作正常** * `apply_patch` * `apply_patch` 创建/更新/删除流程 * `create_file` 需要非空的 `diff` 或 `content` * `update_file` 需要非空的 `diff` 或 `content` * `delete_file` 无需 `diff` 即可工作 * `shell` * `web_search` * `web_search` 使用 TBG(O)llama-swap 内置的网络搜索 * `file_search` * `view_image` * `request_user_input` * `update_plan` * `spawn_agent` * `wait_agent` * `send_input` * `resume_agent` * `close_agent` * `supports_search_tool` 目录不一致 * `agent_send_input_roundtrip` * `agent_subagent_same_model` * `shell_patch_verify_sequence` * `web_research_then_notes` * `plan_act_switch_impl` * `multi_web_patch_verify` * `skill_create_and_use_local` * `workspace_summary_then_plan` * `skill_read_local` * `direct_plan_no_web` * `web_research_then_plan` * `file_search_then_patch` * `view_image_then_report` * 无效 `apply_patch` 重试耗尽后不再以虚假的进度描述结束 * 在 `apply_patch` 损坏后具有更安全的恢复分支 * 从指令中提取错误的 patch-intent/path-hint * 由于上游采用不健康或重复导致的重连 Bug * 长延迟 `502` 超时路径缩短并得到改进 * 原生 vs 本地对比适配器: * `init` * `compare` * 每个场景的 `comparison.json` * 顶层 `comparison_summary.json` * 工具表面差异 * 项目类型差异 * 流/补全差异 * 最终可见文本差异 * 分组的 UX 摘要差异 **在桥接合约中实现** * 更严格分离: * 可见的助手文本 * 工具调用项 * 工具输出 * 文件/代码工件 * 显式的连续状态处理: * 研究流程 * 写入等待流程 * 验证流程 * 最终答案移交 **已修复到可以工作,但尚未达到原生完美** * 分组搜索 * 分组工具调用 * 分组文件更改 * 可折叠的内部历史记录 这些领域在 UI 和适配器方面都有显著改进,但我仍会将它们描述为*部分对齐*,尚未完全实现原生一致性。 **已修复** * `mcp__playwright__browser_navigate` * `mcp__playwright__browser_snapshot` * `mcp__playwright__browser_click` * `mcp__playwright__browser_evaluate` * `mcp__playwright__browser_resize` * `mcp__playwright__browser_take_screenshot` 重要的细微差别: * llama-swap 现在更准确地保留和暴露这些内容 * 然而,WSL Codex 路由器仍然拒绝 Playwright 叶子调用,因为它们在该表面上不受支持 * 这现在被跟踪为一个已知的局限性,而不是活跃的 llama-swap 桥接 Bug **仍未完全解决 / 需要更多工作** * 完整的原生风格分组工作者 UX 等效性 * 在长多步运行期间存在的一些剩余模型质量怪癖 * 围绕格式错误的推理/文本分割的连续/报告润色
查看原文

相似文章

Qwen/Qwen3.6-27B

Hugging Face Models Trending

Qwen 在 Hugging Face 上发布了开源权重模型 Qwen3.6-27B,该模型具备更高的稳定性、强大的智能体编程能力以及思维链保留特性,有助于提升开发者的工作效率。

Qwen 3.7 Max

Reddit r/LocalLLaMA

Qwen 3.7 是一款来自中国实验室的新AI模型,令人印象深刻,讨论焦点在于其权重是否可供下载。

Qwen3.6-27B-GGUF 重磅发布!

Reddit r/LocalLLaMA

社区 GGUF 版本上线,Qwen 27B 混合架构模型支持 262K 上下文、多模态输入、工具调用,并保留“思考过程”,专为智能体编程而生。