code-switching

#code-switching

面向数据高效的代码切换ASR的强化学习

arXiv cs.CL ↗ · 2026-07-07 缓存

介绍了一种具有可验证奖励的强化学习方案，用于将音频语言模型数据高效地适应到代码切换ASR，在10个语言对上以最少数据实现了显著提升。

0 人收藏 0 人点赞

#code-switching

@alamin_ai_: 天哪，伙计们，这太难以置信了请听一下黎凡特阿拉伯语和英语之间的无缝代码切换，提高了7…

X AI KOLs Following ↗ · 2026-07-06 缓存

在黎凡特阿拉伯语语音合成和英语代码切换方面取得了重大突破，使用单张RTX 3060在一晚上实现了76%的提升。

0 人收藏 0 人点赞

#code-switching

我给我的语音代理更换了TTS，结果它比任何其他方式都更有效地减少了人们实际感受到的延迟

Reddit r/AI_Agents ↗ · 2026-07-06

作者分享了将语音代理中的TTS替换为专为双语（阿拉伯语和英语）对话设计的自定义模型（Banter 1）的经验，这显著降低了感知延迟。

0 人收藏 0 人点赞

#code-switching

通过细化的安全定向嵌入利用（STEER）

arXiv cs.AI ↗ · 2026-07-03 缓存

本文介绍了STEER，一种梯度引导的攻击方法，通过将高归因词翻译成低资源语言来绕过拒绝机制，利用了大语言模型安全训练分布的漏洞，在AdvBench上实现了高达96.7%的攻击成功率，并迁移到GPT-4o-mini上达到35.5%的攻击成功率。

0 人收藏 0 人点赞

#code-switching

通过渐进式代码切换实现高效的多语言推理迁移

arXiv cs.CL ↗ · 2026-07-02 缓存

本文提出渐进式代码切换（PCS），这是一种结合课程学习的强化学习方法，逐步增加LLM中的代码切换比例，从而实现多语言推理能力的高效迁移。

0 人收藏 0 人点赞

#code-switching

Universal-3.5 Pro

Product Hunt ↗ · 2026-07-01

Universal-3.5 Pro 改进了本地语码切换、说话人分离，并增加了更多语言，提升了语音识别能力。

0 人收藏 0 人点赞

#code-switching

多脚本情境下的重要性：临床环境中的ASR评估

arXiv cs.CL ↗ · 2026-06-17 缓存

介绍了MultiClin，一个用于评估多脚本临床环境中ASR性能的基准测试，结果表明脚本统一化比传统的单一参考指标更能提升性能。

0 人收藏 0 人点赞

#code-switching

语音助手能处理双语客户吗？前沿ASR在代码切换语音上的基准测试

Hugging Face Blog ↗ · 2026-06-09 缓存

ServiceNow AI 发布了一个基准测试和数据集，用于评估自动语音识别（ASR）在跨四种语言对（西班牙语-英语、法语-英语、加拿大法语-英语、德语-英语）的企业HR和IT场景中的代码切换语音上的表现，发现当前前沿ASR模型在代码切换方面仍存在困难，导致错误率较高。

0 人收藏 0 人点赞

#code-switching

用于鲁棒代码切换语音识别的基于LLM生成的近失对比训练

arXiv cs.CL ↗ · 2026-06-08 缓存

提出了一种POI感知的对比训练框架，利用LLM生成的近失假设来增强ASR在代码切换区域的鲁棒性，在两个基准测试上实现了一致的错误率降低。

0 人收藏 0 人点赞

#code-switching

迈向真正多语言ASR：将代码切换ASR泛化到未见过的语言对

Hugging Face Daily Papers ↗ · 2026-06-04 缓存

本文研究了从有限的已见语言对学到的代码切换ASR能力是否可以通过模型合并和域泛化方法泛化到未见过的语言对，结果发现只有有限的迁移。

0 人收藏 0 人点赞

#code-switching

BOUTEF：北非假新闻的多语言语料库——语言作为武器

arXiv cs.CL ↗ · 2026-06-02 缓存

本文介绍了BOUTEF，一个用于研究阿尔及利亚和突尼斯假新闻的大规模多语言语料库，涵盖阿拉伯方言、Arabizi、法语、英语及语码转换。该语料库包含对语言策略和互动动态的实证分析。

0 人收藏 0 人点赞

#code-switching

面向中英文混合语音识别的音频大语言模型直接偏好优化

arXiv cs.CL ↗ · 2026-05-26 缓存

本文应用直接偏好优化（DPO）来对齐音频大语言模型，以转录中英文混合语音，在分布内实现了高达89.6%的MER降低，在分布外实现了20%的降低。它识别出三种失败模式——语言遗漏、翻译替代转录以及幻觉——并表明基于偏好的对齐能有效激发多语言音频大语言模型的正确混合转写行为。

0 人收藏 0 人点赞

#code-switching

商业ASR系统在代码切换语音上的基准测试：阿拉伯语、波斯语和德语

arXiv cs.CL ↗ · 2026-05-20 缓存

本文提出了一个基准测试，评估了五个商业ASR系统在阿拉伯语-英语、波斯语-英语和德语-英语代码切换语音上的性能，使用两阶段管道为每个语言对选择300个样本，并通过WER和BERTScore评估性能。ElevenLabs Scribe v2在整体上取得了最低的WER（13.2%）和最高的BERTScore（0.936），并提供公开数据集。

0 人收藏 0 人点赞

#code-switching

MUSCAT：多语言科学对话基准

arXiv cs.CL ↗ · 2026-04-20 缓存

MUSCAT是一个新的多语言科学对话基准数据集，用于评估ASR系统在具有挑战性的多语言场景中的表现，包括代码混合、特定领域词汇和混合语言输入。该数据集包含使用不同语言的说话者之间关于科学论文的双语讨论，结果表明当前的最先进系统在应对这些多语言挑战时存在困难。

0 人收藏 0 人点赞

#code-switching

多语言思维，而非更难的思维：教授推理模型代码切换的数据高效框架

arXiv cs.CL ↗ · 2026-04-20 缓存

本文介绍了一个数据高效的微调框架，用于教授推理模型有效地进行代码切换（混合使用多种语言），证明了战略性的代码切换可以提升低资源语言的推理能力。该工作分析了大型语言模型在不同语言、任务和领域中的代码切换行为，并开发了促进有益代码切换模式的干预措施。

0 人收藏 0 人点赞

#code-switching

语码转换信息检索：基准、分析与现有检索器的局限

Hugging Face Daily Papers ↗ · 2026-04-19 缓存

研究者发布 CSR-L 与 CS-MTEB 基准，发现语码转换查询使 IR 系统性能下降高达 27%，并揭示嵌入空间 divergence 是当前多语言技术无法修复的根本原因。

0 人收藏 0 人点赞

code-switching

提交意见反馈