natural-language-processing

标签

Cards List
#natural-language-processing

为什么AI系统仍然难以理解人类对话中的不确定性?

Reddit r/artificial · 2026-06-19

本文探讨了为何AI系统在理解人类对话中的不确定性和歧义方面存在困难,并强调了自然语言理解领域持续面临的挑战。

0 人收藏 0 人点赞
#natural-language-processing

@jreuben1: Speech and Language Processing(第3版草案)Dan Jurafsky 和 James H. Martin https://web.stanford.edu/~jurafsky/slp3…

X AI KOLs Following · 2026-06-19 缓存

2026年1月6日发布的《Speech and Language Processing》第3版草案由Dan Jurafsky和James H. Martin撰写,采用了修订后的结构,重点关注大型语言模型并更新了章节。

0 人收藏 0 人点赞
#natural-language-processing

用于序列标注的近似结构化扩散

arXiv cs.CL · 2026-06-18 缓存

本文介绍了近似结构化扩散(Approximate Structured Diffusion),一种将条件随机场(CRF)与离散扩散相结合用于序列标注的方法。它使用以噪声标签序列为条件的CRF和近似平均场推理,在词性标注上实现了16.5%的错误率降低。

0 人收藏 0 人点赞
#natural-language-processing

PEC-Home:智能家居中递进省略命令的解释

arXiv cs.CL · 2026-06-18 缓存

本文介绍了PEC-Home,一个用于解释智能家居中递进省略命令的模拟家居数据集,并发现当前基于LLM的助手由于指代歧义和意图歧义而难以处理此类命令。

0 人收藏 0 人点赞
#natural-language-processing

可能还是确定?评估临床文本中诊断不确定性保持能力的基准

arXiv cs.CL · 2026-06-18 缓存

本文介绍了一个包含1,200份临床文档和9,184条不确定性标注的基准,用于评估LLMs是否能在临床文本中保持诊断不确定性,结果发现LLMs常常无法保留原始不确定性线索,且在细微区别上表现不佳。

0 人收藏 0 人点赞
#natural-language-processing

自我评价之言:大语言模型在机器翻译中的口头化置信度研究

arXiv cs.CL · 2026-06-17 缓存

本文研究了从大语言模型中提取机器翻译输出置信度的口头化方法,并将其与内部token概率进行了比较。研究发现,尽管两种方法在错误检测和校准方面表现相似,但内部置信度与口头化置信度之间几乎没有相关性。

0 人收藏 0 人点赞
#natural-language-processing

Web规模LLM预训练数据中叙事内容的特征刻画

Hugging Face Daily Papers · 2026-06-17 缓存

对Web规模LLM预训练数据中叙事特征的细粒度研究,引入了NarraBERT和NarraDolma来测量叙事模式及其在不同来源中的分布。

0 人收藏 0 人点赞
#natural-language-processing

Sumi:从头训练的开放均匀扩散语言模型

Hugging Face Daily Papers · 2026-06-17 缓存

Sumi 是一个 7B 参数的均匀扩散语言模型,在 1.5T token 上从头预训练,在知识和推理任务上取得了有竞争力的性能,同时完全开源,发布了模型权重和训练方案。

0 人收藏 0 人点赞
#natural-language-processing

将示例提炼为任务指令:面向真实B2B对话的增强型上下文学习

arXiv cs.CL · 2026-06-16 缓存

本文介绍了用于分类真实B2B对话的Call Playbook数据集,并提出将示例提炼为紧凑、可解释的任务指令的方法,相比传统上下文学习实现了99%的Token压缩和高达7%的AUC提升。

0 人收藏 0 人点赞
#natural-language-processing

大语言模型能否可靠识别失语症语篇中的正确信息单元?

arXiv cs.AI · 2026-06-16 缓存

本研究探究了经过指令微调的大语言模型(Llama-3.1-8B、Qwen2.5-7B、Mistral-7B、Phi-3-mini)能否可靠地分类失语症语篇转录中的正确信息单元。少样本提示使三个模型获得了具有竞争力的F1分数(0.776–0.817),但性能因严重程度而异,且与人类标注的一致性仍不足以实现完全自主使用。

0 人收藏 0 人点赞
#natural-language-processing

CoCoGEC:用于鲁棒语法错误纠正的反事实生成

arXiv cs.CL · 2026-06-16 缓存

提出CoCoGEC,一种反事实生成框架,通过改变GEC训练数据中与错误无关的上下文来提升模型鲁棒性,在扰动基准上取得了显著的F0.5提升。

0 人收藏 0 人点赞
#natural-language-processing

治疗药物-疾病关系的适用条件提取

arXiv cs.AI · 2026-06-15 缓存

本文介绍了从生物医学文献中提取治疗药物-疾病关系适用条件的任务,创建了一个手动标注的三元组数据集,并提出了一种增强LoRA的方法,该方法优于现有基线方法。

0 人收藏 0 人点赞
#natural-language-processing

危机中的应对:2023年土耳其地震数字危机话语中应对风格的计算建模

arXiv cs.CL · 2026-06-15 缓存

本文提出了一种用于分析数字危机话语中应对风格的计算模型,并具体应用于2023年土耳其地震。

0 人收藏 0 人点赞
#natural-language-processing

学习听出犹豫:面向非流利感知的连续学习ASR

arXiv cs.CL · 2026-06-15 缓存

本文提出了一种连续学习方法,将非流利标记整合到预训练的ASR模型中,解决了灾难性遗忘问题,并提升了对非流利语音的识别能力。

0 人收藏 0 人点赞
#natural-language-processing

语言学奥林匹克竞赛:迈向语言学研究的新语料库?

arXiv cs.CL · 2026-06-15 缓存

本文提出利用语言学奥林匹克竞赛数据构建新的语言学研究语料库,旨在推动该领域发展。

0 人收藏 0 人点赞
#natural-language-processing

Google发布Gemini-SQL2,突破性文本转SQL能力模型

Reddit r/singularity · 2026-06-12

Google发布Gemini-SQL2,这是一个由Gemini 3.1 Pro驱动的文本转SQL模型,在BIRD基准测试中取得了最先进的结果,能够将自然语言转换为准确的SQL查询。

0 人收藏 0 人点赞
#natural-language-processing

面向低资源阿尔及利亚方言的端到端混合谣言检测框架

arXiv cs.CL · 2026-06-12 缓存

本文提出了一种面向低资源阿尔及利亚方言社交媒体内容的端到端混合谣言检测框架,通过结合Transformer嵌入和经典分类器,达到了0.84的F1分数。

0 人收藏 0 人点赞
#natural-language-processing

HyPE:面向角色对话的类别感知超图编码与持久边嵌入

arXiv cs.CL · 2026-06-12 缓存

HyPE 提出了一种基于超图的角色编码器,通过类别感知超边和持久边嵌入对角色属性间的高阶关系进行建模,在 PersonaChat 数据集上,相较于多个主干模型的平面池化基线,取得了持续的改进。

0 人收藏 0 人点赞
#natural-language-processing

NaturalFlow:减少同时语音翻译中干扰性停顿以促进自然语音流畅

arXiv cs.CL · 2026-06-12 缓存

本文介绍了NaturalFlow,一种流畅性感知的优化框架,它通过利用模型内部信号减少同时语音翻译中的干扰性停顿,在低延迟和自然语音流畅之间取得平衡。

0 人收藏 0 人点赞
#natural-language-processing

SafeLLM:在安全关键场景中,提取作为重写的抗幻觉替代方案

arXiv cs.CL · 2026-06-12 缓存

本文提出SafeLLM,一种基于提取的方法,用于从安全关键文档中检索信息,表明行号选择在减少幻觉的同时保持高召回率方面优于基于重写的RAG方法。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈