标签
GitHub 上又一款开源工具 Shimmy,仅 5MB 单文件,用 Rust 编写,提供快速稳定的本地推理和完整的 OpenAI 兼容 API,直指 Ollama 的痛点,启动不到 100ms,内存占用约 50MB。