text-classification

标签

Cards List
#text-classification

击中移动目标:持续分布漂移下AI文本检测的测试时自适应

arXiv cs.CL · 6小时前 缓存

本文提出了一种基于半监督学习的测试时自适应方法,用于AI文本检测,能够适应来自新LLM、对抗性人工化和时间漂移的持续分布变化,性能优于最先进的监督式检测器。

0 人收藏 0 人点赞
#text-classification

探索Pangram 3.3.2的内部表示

Hacker News Top · 9小时前 缓存

Pangram Labs探索其AI检测模型Pangram 3.3.2的内部表示,分析模型如何在不同层中区分人工文本与AI文本,使用来自多种来源的5,000份文档的平衡数据集。

0 人收藏 0 人点赞
#text-classification

ModTGCN:面向文本分类的模块化感知图神经网络

arXiv cs.CL · 昨天 缓存

ModTGCN是一种模块化感知的图神经网络,通过联合优化交叉熵和基于模块化的辅助目标,利用文档图中的全局社区结构来改进文本分类,在五个基准测试上实现了持续的增益。

0 人收藏 0 人点赞
#text-classification

对齐隐含语句以提升隐含仇恨言论跨数据集泛化性:基于上下文有界半硬负样本挖掘

arXiv cs.CL · 2026-06-18 缓存

本文提出ImpSH,一种基于三元组的隐含仇恨言论分类框架,该框架将帖子与隐含语句对齐,并使用上下文有界半硬负样本挖掘来提高跨数据集的泛化能力。

0 人收藏 0 人点赞
#text-classification

检测议会文本中未披露的LLM生成内容

arXiv cs.CL · 2026-06-15 缓存

本文通过训练一个可解释的文本分类器,评估了英国和瑞典议会文本中未披露的LLM生成内容的程度,发现自2022年以来未披露的LLM使用量稳步增加。

0 人收藏 0 人点赞
#text-classification

结构化提示优化与强化学习结合实现复杂文本的全局与局部可解释性

arXiv cs.CL · 2026-05-29 缓存

介绍了eXTC,一个具有三个渐进阶段的文本分类器:结构化提示优化以学习自然语言规则手册、将推理蒸馏到紧凑的语言模型中、以及强化学习扩展推理,实现了强大的性能和可解释性。

0 人收藏 0 人点赞
#text-classification

面向明清之际文集个人书信标题的微调BERT分类器

arXiv cs.CL · 2026-05-25 缓存

本文介绍Lepton,一个微调的BERT分类器,用于预测古典中文文集目录中的标题是私人信件还是序言(尤其是易混淆的赠序)。该模型利用了来自明末清初三十三位文人的5,438条手工标注标题。

0 人收藏 0 人点赞
#text-classification

基于一致性和标签解耦的可解释判别性文本表示

arXiv cs.CL · 2026-05-21 缓存

本文提出了一种基于注释者间一致性和标签解耦的可解释文本表示的操作性标准,并引入了LLM辅助特征发现(LFD)方法,该方法通过跨LLM一致性筛选和残差预测增益来选择清晰、标签解耦的特征。实验表明,LFD在保持预测性能的同时,产生了更可解释的特征,并通过人工审计进行了验证。

0 人收藏 0 人点赞
#text-classification

在心理防御分类中利用上下文感知的合成增强缓解数据稀缺问题

arXiv cs.CL · 2026-05-15 缓存

本文提出了一种结合上下文感知合成增强框架与混合分类模型的方法,以解决从文本中分类心理防御机制时的数据稀缺和类别不平衡问题。该方法在 PsyDefDetect 共享任务基准上取得了显著改进。

0 人收藏 0 人点赞
#text-classification

德语政治文本的意识形态预测

arXiv cs.CL · 2026-05-15 缓存

该论文提出了一种基于Transformer的模型,用于在连续的左-右光谱上预测德语政治文本的政治意识形态。研究比较了13个模型,发现DeBERTa-large和Gemma2-2B在不同任务上表现最佳。

0 人收藏 0 人点赞
#text-classification

LLM智能体可预测社交媒体反应但仍不敌文本分类器:基于1511人12万+人格的仿真准确性基准测试

arXiv cs.CL · 2026-04-23 缓存

大规模研究发现,LLM智能体以70.7%的准确率预测个人社交媒体反应,却仍落后于简单TF-IDF分类器,凸显其操控风险与政策模拟价值。

0 人收藏 0 人点赞
#text-classification

基于文本与音频分类器的学生异常言语响应检测

arXiv cs.CL · 2026-04-21 缓存

# 基于文本与音频分类器的学生异常言语响应检测 来源:[https://arxiv.org/html/2604.16717](https://arxiv.org/html/2604.16717) \(论文将于2026年4月10日在国家教育测量委员会会议上发表\) ###### 摘要 本文旨在填补自动言语响应评分(AVRS)使用中的一项关键安全空白。我们提出了一种新颖的混合框架,用于识别存在心理困扰的学生,该框架结合了文本分类器与音频分类器;其中文本分类器经过训练以根据内容检测响

0 人收藏 0 人点赞
#text-classification

用于识别AI生成文本的新型分类器

OpenAI Blog · 2023-01-31 缓存

# 用于识别AI生成文本的新型分类器 来源:[https://openai.com/index/new-ai-classifier-for-indicating-ai-written-text/](https://openai.com/index/new-ai-classifier-for-indicating-ai-written-text/) 我们认识到,在教育工作者中,识别AI生成的文本一直是一个重要的讨论话题,同样重要的是认识到AI文本分类器在课堂中的局限性和影响。我们开发了一个[初步资源⁠\(在新窗口中打开\)](ht

0 人收藏 0 人点赞
#text-classification

半监督文本分类的对抗训练方法

OpenAI Blog · 2016-05-25 缓存

本文提出了针对文本分类的对抗训练和虚拟对抗训练方法,通过在RNN中对词嵌入而非原始输入施加扰动来实现。该方法在半监督和监督文本分类基准上取得了最先进的结果,同时降低了过拟合。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈