multilingual

#multilingual

Tower-Plus-72B-Ultra-Uncensored-Heretic，一个支持22种语言的模型，非常适合多语言任务，在翻译相关工作中表现出色，且无需审查，现在超无审查，拒绝率仅5/100！

Reddit r/LocalLLaMA ↗ · 2026-06-15 缓存

Tower-Plus-72B-Ultra-Uncensored-Heretic 是 Unbabel/Tower-Plus-72B 的无审查版本，支持22种语言，擅长翻译任务，拒绝率极低。

0 人收藏 0 人点赞

#multilingual

Command A Plus GGUFs 已发布

Reddit r/LocalLLaMA ↗ · 2026-06-15 缓存

Cohere 已发布其 Command A+ 模型的 GGUF 量化版本（25B 活跃参数 / 218B 总参数，Apache 2.0），用于本地推理，针对智能体和多语言任务进行了优化。

0 人收藏 0 人点赞

#multilingual

@Gorden_Sun: ZONOS2：开源MoE TTS模型 8B总参数，0.9B激活参数。支持多语言，支持语音克隆，支持中文，中文效果不错。模型：

X AI KOLs Timeline ↗ · 2026-06-13 缓存

Zyphra released ZONOS2, an open-source MoE text-to-speech model trained on over 6 million hours of multilingual speech, supporting voice cloning and high-quality synthesis across many languages.

0 人收藏 0 人点赞

#multilingual

对2023年初的模型在两个指令遵循数据集上进行微调后效果变得很好

Reddit r/LocalLLaMA ↗ · 2026-06-12

一个在550步内对两个指令遵循数据集进行微调的Pythia-6.9B模型，具备了13种语言的能力，相比基础模型有显著提升。

0 人收藏 0 人点赞

#multilingual

当相似意味着不同：评估LLM在阿拉伯语-希伯来语同源词上的表现

arXiv cs.CL ↗ · 2026-06-12 缓存

本文介绍了SemCog Bench，这是一个精心整理的基准测试，包含1,858个阿拉伯语-希伯来语词对，并带有句子级别的注释，用于评估LLM区分真同源词、假同源词和借词的能力。结果显示，模型在真同源词上准确率很高，但在假同源词上准确率大幅下降，突显了跨语言语义推理中的一个关键局限性。

0 人收藏 0 人点赞

#multilingual

Polar：评估LLM政治偏见的基准

arXiv cs.CL ↗ · 2026-06-12 缓存

Polar是一个包含4,026个多选题的基准，用于评估LLM在美国和韩国政治背景下的政治偏见，通过选项级似然度来测量偏见。对38个LLM的实验显示，系统性偏见模式因政治背景、议题类别和呈现语言而异。

0 人收藏 0 人点赞

#multilingual

X-MADAM-RAG: 诊断与处理检索增强生成中的中英文证据冲突

arXiv cs.CL ↗ · 2026-06-12 缓存

本文介绍了X-RAMDocs-ZHEN——一个用于诊断检索增强生成中证据冲突的可控中英文基准测试，以及X-MADAM-RAG——一个可解释的流水线。该流水线在原始基准测试上优于基线模型，但在自然化压力测试下展现了局限性，凸显了文档级提取是一个关键瓶颈。

0 人收藏 0 人点赞

#multilingual

@XAMTO_AI: 这个开源工具要是现在不收藏，将来肯定得后悔——视频自动配音翻译，一口气支持 33 种语言，还能直接对视频内容提问。在 GitHub 上发现一个宝藏工具，叫 Violin，完全开源，做的事情说出来有点离谱：你把视频丢进去，它自动识别语音、…

X AI KOLs Timeline ↗ · 2026-06-12 缓存

Violin 是一个开源的视频自动配音翻译工具，支持33种语言，集成Whisper、DeepSeek等模型，提供一键式语音识别、翻译、配音合成及视频内问答功能。

0 人收藏 0 人点赞

#multilingual

@AdinaYakup: 百度 @PaddlePaddle 发布 PP-OCRv6：tiny 1.5M / small 7.7M / medium 34.5M，支持 48+ 种语言，支持手写/……

X AI KOLs Following ↗ · 2026-06-11 缓存

百度 PaddlePaddle 发布了 PP-OCRv6，一款支持 48+ 种语言的 OCR 模型，提供 tiny（1.5M）、small（7.7M）和 medium（34.5M）三种尺寸，针对边缘部署进行了优化，可处理手写、印刷、工业、屏幕和卡片文字。

0 人收藏 0 人点赞

#multilingual

Schützen: 在保加利亚语和德语语境中评估LLM安全性

arXiv cs.CL ↗ · 2026-06-11 缓存

介绍Schützen，一个用于评估保加利亚语和德语中LLM安全性的安全数据集，揭示了安全行为中的跨语言差异，并倡导开发针对特定区域的评估资源。

0 人收藏 0 人点赞

#multilingual

一次越狱，多种语言：学习语言不敏感的意图表示用于多语言越狱检测

arXiv cs.CL ↗ · 2026-06-11 缓存

本文提出MLJailDe，一个多语言越狱检测框架，利用反向翻译数据增强和相对距离约束来提高跨语言泛化能力和鲁棒性，在11种语言上实现了98.5%的F1分数。

0 人收藏 0 人点赞

#multilingual

prefeitura-rio/Rio-3.5-Open-397B

Hugging Face Models Trending ↗ · 2026-06-11 缓存

Rio 3.5 Open 397B 是一个开源的前沿AI模型，基于 Qwen 3.5 397B 进行后训练，采用 SwiReasoning 实现动态显式/隐式推理切换，在智能体编程、推理和多语言基准测试中取得了最先进的性能。

0 人收藏 0 人点赞

#multilingual

Zyphra/ZONOS2

Hugging Face Models Trending ↗ · 2026-06-11 缓存

ZONOS2 是 Zyphra 推出的一款新型文本转语音模型，基于超过600万小时的多语言语音数据训练，采用混合专家架构，实现高质量语音克隆和低延迟。支持30多种语言，并提供高性能推理服务器。

0 人收藏 0 人点赞

#multilingual

ArogyaSutra：面向印度语言中多模态医学推理的多智能体框架

Hugging Face Daily Papers ↗ · 2026-06-11 缓存

ArogyaBodha数据集和ArogyaSutra框架通过多样化数据集成和actor-critic多智能体推理，增强了低资源环境下的多语言医学推理能力。

0 人收藏 0 人点赞

#multilingual

基于自监督表示和学习动态规划的多语言词级强制对齐

arXiv cs.CL ↗ · 2026-06-10 缓存

一种新颖的多语言词级强制对齐方法，结合了来自MMS的自监督表示和音素边界检测器，以及一个学习动态规划解码器，在英语和未见过的语言上优于现有对齐方法，无需额外训练。

0 人收藏 0 人点赞

#multilingual

哪种LoRA？多语言指令微调中LoRA技术有效性的实证研究

arXiv cs.CL ↗ · 2026-06-10 缓存

本文实证比较了多种LoRA变体在多语言指令微调中的表现，发现复杂变体在平衡跨语言迁移与知识保留方面相比基本LoRA并无显著优势。

0 人收藏 0 人点赞

#multilingual

语音助手能处理双语客户吗？前沿ASR在代码切换语音上的基准测试

Hugging Face Blog ↗ · 2026-06-09 缓存

ServiceNow AI 发布了一个基准测试和数据集，用于评估自动语音识别（ASR）在跨四种语言对（西班牙语-英语、法语-英语、加拿大法语-英语、德语-英语）的企业HR和IT场景中的代码切换语音上的表现，发现当前前沿ASR模型在代码切换方面仍存在困难，导致错误率较高。

0 人收藏 0 人点赞

#multilingual

Google发布Gemini 3.5 Live Translate，实现即时语音到语音翻译

Ars Technica ↗ · 2026-06-09 缓存

Google发布Gemini 3.5 Live Translate，这是一种语音到语音模型，可在70多种语言中提供即时语音翻译，并正在Google生态系统中推广。

0 人收藏 0 人点赞

#multilingual

@livekit: 我们使用LiveKit上的Gemini 3.5 Live Translate构建了一个实时多语言多人视频通话。每个人选择自己的语言…

X AI KOLs Following ↗ · 2026-06-09 缓存

LiveKit 使用 Gemini 3.5 Live Translate 构建了一个实时多语言视频通话，参与者可以用自己的语言发言并实时听到翻译。开源代码可在 GitHub 上获取。

0 人收藏 0 人点赞

#multilingual

借助 Gemini 3.5 Live Translate 实现流畅自然的语音翻译

Google DeepMind Blog ↗ · 2026-06-09 缓存

Google 发布了 Gemini 3.5 Live Translate，这是一款音频模型，支持超过 70 种语言的近乎实时的语音到语音翻译，并保留说话者的语调和节奏。该功能正在 Google 产品中逐步推出，包括 Gemini Live API、Google Meet 和 Google Translate。

0 人收藏 0 人点赞

multilingual

提交意见反馈