Whisperian：如果你希望在Android上使用麦克风配合本地ASR模型，它是最佳应用之一。该应用也可在Play Store获取。

Reddit r/LocalLLaMA 2026/06/28 09:11 工具

android asr speech-recognition local-models playstore whisperian

摘要

Whisperian是一款Android应用，允许用户使用麦克风配合本地自动语音识别（ASR）模型，且该应用可在Play Store获取。

暂无内容

查看原文

相似文章

如果应用需要实时语音转文字，Whisper 是否仍是最佳默认选择？

Reddit r/AI_Agents

探讨在考虑替代方案和性能权衡的情况下，OpenAI 的 Whisper 是否仍是实时语音转文字应用的首选。

Whisper 介绍

OpenAI Blog

OpenAI 推出 Whisper，这是一个端到端的编码器-解码器 Transformer 模型，在大规模多样化音频数据上进行训练，可提供强大的多语言语音识别、语言识别和语音到英文翻译功能。Whisper 在多样化数据集上的错误率比专业模型低 50%，并且在语音翻译方面优于有监督基准，尽管未针对特定数据集进行微调。

@XieZhifei14110: 别再使用Whisper做语音识别了！开源Mega-ASR——首个全场景SOTA工业级ASR模型，专为……

X AI KOLs Timeline

开源Mega-ASR，一个全场景SOTA工业级ASR模型，专为远场、噪声等复杂音频环境设计，在真实世界基准测试中比现有开源和闭源模型性能高出10-30%。

@FeitengLi: 其实这些问题都能很好的解决了 1. 扔掉 whisper，换 ASR 模型，Qwen3-ASR 就很不错幻觉很少、也有一些别的ASR选择，whisper 幻觉多也要求 30s片段，Qwen3-ASR 塞更长的音频识别越准确，最大支持 20…

X AI KOLs Timeline

推荐使用Qwen3-ASR替代Whisper以减少幻觉，使用LattifAI工具进行精确的音文本对齐和字幕生成，并介绍自己的OmniVAD-Kit项目用于语音活动检测。

@HowToAI_: ElevenLabs刚刚失去了护城河有人开源了一款单一应用，可替代ElevenLabs和WisprFlow，且100%本地运行…

X AI KOLs Timeline

一款名为Voicebox的开源应用替代了ElevenLabs和WisprFlow，支持本地语音克隆、多种TTS引擎和MCP服务器，可在多种硬件上运行，采用MIT许可证。

相似文章

如果应用需要实时语音转文字，Whisper 是否仍是最佳默认选择？

Whisper 介绍

@XieZhifei14110: 别再使用Whisper做语音识别了！开源Mega-ASR——首个全场景SOTA工业级ASR模型，专为……

@FeitengLi: 其实这些问题都能很好的解决了 1. 扔掉 whisper，换 ASR 模型，Qwen3-ASR 就很不错幻觉很少、也有一些别的ASR选择，whisper 幻觉多也要求 30s片段，Qwen3-ASR 塞更长的音频识别越准确，最大支持 20…

@HowToAI_: ElevenLabs刚刚失去了护城河 有人开源了一款单一应用，可替代ElevenLabs和WisprFlow，且100%本地运行…

提交意见反馈

@HowToAI_: ElevenLabs刚刚失去了护城河有人开源了一款单一应用，可替代ElevenLabs和WisprFlow，且100%本地运行…