标签
Pair Translate is an open-source browser extension that enables side-by-side translation using various AI models like ChatGPT and Gemini, prioritizing user privacy by processing data locally.
User recommends Read Frog (陪读蛙) as a superior alternative to Immersive Translate, highlighting its context-aware translation, cost-efficiency, and support for various AI models and Edge TTS.
Pair Translate 是一款开源浏览器翻译插件,支持词级、段落级、整页翻译,可选 Google、DeepL、ChatGPT、Gemini 等多种翻译引擎,支持双语对照显示,已上架 Chrome、Firefox、Edge 商店。
OpenAI发布了GPT-Realtime-2语音模型,具备GPT-5级别的推理能力和128,000 token上下文窗口,支持实时翻译70多种语言到13种输出语言,在Big Bench Audio Intelligence评测中达到96.6%准确率,Greg Brockman称其为语音翻译领域的里程碑。
用户记录:闭源模型(GPT-4o→5.3、Gemini)在翻译中文小说时质量下滑并自我审查,而本地 Gemma 4 31B 不仅零审查,翻译质量也全面反超。
# 并非放之四海而皆准:多语言大语言模型中从固定提示到可学习路由的演进 来源:[https://arxiv.org/html/2604.16937](https://arxiv.org/html/2604.16937) Wei-Chi Wu, Sheng-Lun Wei, Hen-Hsen Huang, Hsin-Hsi Chen α 台湾大学电脑科学与资讯工程学系,台湾 β 中央研究院资讯科学研究所,台湾 γ 台湾大学人工智能研究中心(AINTU),台湾 wcwu@c
Google 更新了 Gemini 2.5 Flash Native Audio,以提升实时语音智能体的能力,包括更精准的函数调用、更好的指令遵循能力,以及更流畅的对话上下文检索。此次更新还在 Google Translate 应用 beta 版中引入了实时语音翻译功能,可在 70 多种语言中保留语音语调。
明尼苏达州企业翻译办公室已成功部署 ChatGPT 以提高翻译速度和准确性,同时保持文化相关性,已于七月完成全面推出,并正在进行有前景的实时语音口译试点项目。
OpenAI 推出 Whisper,这是一个端到端的编码器-解码器 Transformer 模型,在大规模多样化音频数据上进行训练,可提供强大的多语言语音识别、语言识别和语音到英文翻译功能。Whisper 在多样化数据集上的错误率比专业模型低 50%,并且在语音翻译方面优于有监督基准,尽管未针对特定数据集进行微调。