650多个Apache-2.0许可的生物医学NER/去标识化模型,在MLX中设备端运行。相同fp32权重,输出一致:临床NER模型在3年前的M3 Max上比PyTorch-CPU快30-40倍。内部可复现。

Reddit r/LocalLLaMA 模型

摘要

650多个Apache-2.0许可的生物医学NER和去标识化模型集合,通过MLX在设备端运行,在M3 Max上实现比PyTorch-CPU快30-40倍的推理速度,且输出一致。

暂无内容
查看原文

相似文章