@LucSGeorges: 性能满载版本:safetensors 0.8.0 发布。主要亮点:- 直接复制到 Metal MTLBuffers + 使用 dlpack 实现零拷贝…

X AI KOLs Following 工具

摘要

safetensors 0.8.0 版本带来了重大性能提升:通过 dlpack 直接复制到 Metal MTLBuffers,实现 2-3 倍的加载速度提升,并修复了 macOS 上的 OOM 问题;同时支持无 GIL 序列化,加快多文件保存速度。

性能满载版本:safetensors 0.8.0 发布 主要亮点: - 直接复制到 Metal MTLBuffers + 使用 dlpack 实现向目标框架(目前仅支持 torch)的零拷贝传递 -> 2-3 倍性能提升,并修复了使用 transformers 加载接近统一内存上限的模型时在 macOS 上出现的 OOM 问题 - 无 GIL 的序列化,支持从 Python 进行多线程保存 -> 单个文件速度提升 1.2 到 2 倍,但并行保存多个文件时预期将获得更大提升! 查看发布说明,了解全部改进内容!
查看原文
查看缓存全文

缓存时间: 2026/06/10 13:51

perf packed release: safetensors 0.8.0 正式发布

主要亮点:

  • 直接拷贝到 Metal MTLBuffer + DLPack,实现零拷贝交付到目标框架(目前仅支持 torch) -> 性能提升 2-3 倍,并修复了在 macOS 上使用 transformers 加载接近统一内存限制的模型时出现的 OOM 问题

  • 无 GIL 序列化,支持从 Python 进行多线程保存 -> 单个文件保存速度提升 1.2~2 倍,并行保存多个文件时预计会有更显著的提升!

查看发布说明获取完整改进列表!

相似文章