vaibhavs10/incredibly-fast-whisper

Replicate Explore 模型

whisper transcription speed-optimization flash-attention replicate transformers

摘要

一个高度优化的OpenAI Whisper Large v3版本，使用Transformers、Optimum和Flash Attention 2，能够在Replicate上在2分钟内转录150分钟的音频。

vaibhavs10 / incredibly-fast-whisper

查看缓存全文

缓存时间: 2026/05/08 06:25

# Fast Whisper：在 Replicate 上实现高速转录来源：https://replicate.com/vaibhavs10/incredibly-fast-whisper ## 极速 Whisper 由 🤗*Transformers*、*Optimum* 和 *flash-attn* 驱动 **TL;DR** — 用 OpenAI 的 Whisper Large v3（https://huggingface.co/openai/whisper-large-v3）在 100 秒内转录 150 分钟的音频。闪电般的转录速度现已成真！⚡️ 优化类型转录时间（150 分钟音频）Transformers（`fp32`）约 31（*31 分 1 秒*）Transformers（`fp16`+`batching [24]`+`bettertransformer`）约 5（*5 分 2 秒*）**Transformers（`fp16`+`batching [24]`+`Flash Attention 2`）**约 2（*1 分 38 秒*）distil-whisper（`fp16`+`batching [24]`+`bettertransformer`）约 3（*3 分 16 秒*）**distil-whisper（`fp16`+`batching [24]`+`Flash Attention 2`）**约 1（*1 分 18 秒*）Faster Whisper（`fp16`+`beam_size [1]`）约 9.23（*9 分 23 秒*）Faster Whisper（`8-bit`+`beam_size [1]`）约 8（*8 分 15 秒*）模型创建时间超过 1 年前

vaibhavs10/incredibly-fast-whisper

相似文章

Whisper 介绍

API 推出全新模型，推动语音智能发展

ChatGPT 和 Whisper API 发布

@kwindla：OpenAI 今天发布了一款新的语音到语音模型：gpt-realtime-2 这是首个足够好的语音到语音模型……

OpenAI 如何实现大规模低延迟语音 AI 部署

提交意见反馈