标签
Shimmy 是一个用 Rust 编写的仅有 5MB 单文件的本地 AI 推理服务器,完美兼容 OpenAI API,启动速度小于 100ms,内存占用仅 50MB,可作为 Ollama 的轻量替代品。