@NFTCPS: 兄弟们,用 DeepSeek V4 Pro 跑 Codex 的,token 烧得心疼吧?这俩 skill 你必须知道。 token-saver:改完代码只回个路径加 done,废话一句没有,实测能省 60-80% token memory…
摘要
为DeepSeek V4 Pro优化的Codex技能,通过冻结skill文件和极简输出可节省60-80% token,并提供跨对话持久记忆功能。
查看缓存全文
缓存时间: 2026/06/18 22:22
兄弟们,用 DeepSeek V4 Pro 跑 Codex 的,token 烧得心疼吧?这俩 skill 你必须知道。
token-saver:改完代码只回个路径加 done,废话一句没有,实测能省 60-80% token
memory:上下文被压缩了也不怕,下次对话自动从 MEMORY.md 把你的习惯、项目结构捡回来,每次才 800 token
核心就一句话:skill 文件写好就冻住别动,缓存命中率才高。手慢的赶紧装。
https://github.com/lokikill123/codex-token-skills…
lokikill123/codex-token-skills
Source: https://github.com/lokikill123/codex-token-skills
⚡ Codex Token Skills
专为 DeepSeek V4 Pro 优化的 Codex skill,大幅降低 token 消耗并提升前缀缓存命中率。
为什么需要?
DeepSeek V4 Pro 的前缀缓存机制:系统提示词 + 上下文文件越稳定,缓存命中率越高。如果你的 SKILL.md / AGENTS.md 频繁变动,每次对话都要重新处理全部上下文,浪费大量 token。
这两个 skill 的核心思路:
| 问题 | 解决方案 |
|---|---|
| 上下文频繁变动 → 缓存失效 | Skill 文件写好后冻结不动 |
| Codex 输出冗长 → token 浪费 | 强制极简输出,改完只说路径+done |
| 上下文压缩 → 丢失记忆 | 用文件做持久记忆,跨对话恢复 |
Skill 列表
🔧 token-saver — 强制省 token
Smart 双模式:
- 简单任务(修 bug、改配置、装东西):禁止 preamble、禁止计划、禁止解释、禁止验证
- 复杂任务(vibecoding、数据分析、架构设计):允许简短交流,但严格控制
实测预计省 60-80% token。
🧠 memory — 全局持久记忆
上下文窗口被压缩后,下次对话自动从 MEMORY.md 恢复:
- 用户偏好与习惯
- 项目结构与关键路径
- 已做决策与反馈
每次仅消耗
~800 token,换来跨对话一致性。
快速安装
# 克隆到 Codex skills 目录
git clone https://github.com/lokikill123/codex-token-skills.git
cp -r codex-token-skills/skills/* ~/.codex/skills/
# 重启 Codex 即可生效
或通过 skill-installer:
install-skill --repo lokikill123/codex-token-skills --path skills/token-saver
install-skill --repo lokikill123/codex-token-skills --path skills/memory
缓存优化原理
[system prompt] + [AGENTS.md] + [各 skill SKILL.md] + [user message]
^^^^^^^^^^^^ ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
系统固定 这部分 skill 文件冻结不变 → 前缀缓存命中 → 省 50%+ token
关键原则:Skill 文件一次写定,永不修改。项目级动态内容放项目目录的 AGENTS.md,不放 skill 里。
搭配建议
token-saver+memory同时激活,效果最大化- 在
~/.codex/AGENTS.md中配置自动激活 - 如需 UI 开发配合,可搭配 mac-style-ui skill(见作者其他 repo)
License
MIT
相似文章
@geekbb: MCP 工具,把 Codex 的低风险活甩给 DeepSeek 干,贵的模型只做判断。五任务测试平均省 48%,延迟 6 秒左右。 CodexSaver 一个 MCP 工具,把 Codex 编码会话中的低风险任务(写测试、写文档、代码解释…
CodexSaver is an MCP tool that offloads low-risk coding tasks (tests, docs, lint fixes) from Codex to a cheaper model like DeepSeek, achieving ~48% cost savings with ~6s latency.
@NFTCPS: 卧槽!DeepSeek 这波是要把市面上的 Agent 一锅端啊,全家桶都给你凑齐了! 连 Reasonix 都没放过,直接收编。 跟你们说人话: 这玩意儿是目前最能帮你省 DeepSeek 账单的原生终端 工具调用稳得一批,不抽风 靠缓…
DeepSeek-Reasonix 是一个基于 DeepSeek 的原生终端 AI 编码代理,通过缓存命中大幅降低 API 成本,工具调用稳定可靠。
@billtheinvestor: 给 Claude Code 和 Codex 无限记忆,编程效率提升92%!Agentmemory 工具已在 GitHub 上火速获得4000+个星标,完全免费。 它通过智能压缩保存你编程会话的所有信息,未来会话中自动提取相关上下文,避免重…
Agentmemory 是一个开源工具,为 Claude Code 和 Codex 提供无限记忆功能,通过智能压缩减少 token 使用量,提升编程效率,已在 GitHub 获得 4000+ 星标。
@Luckyjudy666: 8个小妙招,让Codex成为你的贴身助理 1. 给Codex建一套共享记忆 核心规则放Agents.md,项目背景放Obsidian,重复流程做成skills,个人偏好和常见问题交给Memories。不然,Codex每次像新来的同事,什么…
本文分享了8个使用Codex AI助手的小妙招,包括建立共享记忆、远程执行任务、定时自动化、文件整理、教授新软件操作等,旨在提升工作效率。
@QingQ77: 一个专为 DeepSeek API 前缀缓存机制设计的终端 AI 编程代理,通过缓存优先的架构在长会话中保持超低 token 成本。 https://github.com/esengine/DeepSeek-Reasonix… Reaso…
Reasonix 是一个专为 DeepSeek API 前缀缓存机制设计的终端 AI 编程代理,通过缓存优先架构在长会话中实现超低 token 成本。实测 4.35 亿输入 token 仅花费约 12 美元,缓存命中率 99.82%。