text-analysis

#text-analysis

运用多维文本分析方法评估改革后风险披露质量的变化

arXiv cs.CL ↗ · 2026-06-26 缓存

本文提出了一种结合日语NLP指标和统计方法的多维文本分析方法，用于评估风险披露质量的变化，并应用于日本2019年的企业披露改革。对19,770个公司-年度观测值的分析揭示了复杂的变化，例如披露数量增加但可读性下降。

0 人收藏 0 人点赞

#text-analysis

三个佛教词汇：英语巴利经典中经、律、论三藏的计量文体学分析

arXiv cs.CL ↗ · 2026-06-25 缓存

本文运用计量文体学方法，分析英语译本巴利经典中经藏、律藏和论藏之间的词汇差异。

0 人收藏 0 人点赞

#text-analysis

Persuasion Index: 一个理论指导的说服分析框架

arXiv cs.CL ↗ · 2026-06-15 缓存

介绍了Persuasion Index (PI)，一个包含15个维度和55个子特征的理论指导框架，用于分析文本中的说服修辞线索。该框架模块化、开源，并在四个数据集上进行了评估，为与说服相关的结果提供了可解释的特征空间。

0 人收藏 0 人点赞

#text-analysis

文本语义信息的几何轮廓：框架条件唯一性与标量摘要的权衡三角形

arXiv cs.CL ↗ · 2026-06-11 缓存

本文开发了一个几何框架，利用句子嵌入来衡量文本的语义内容，提出了一个三维语义轮廓（新颖性、广度、整合性）和一个标量权衡三角形，并在合成类别和小说中进行了验证。

0 人收藏 0 人点赞

#text-analysis

符号学视角下的思考：PEEL 作为认识论负责任的 AI 辅助研究的支架框架

arXiv cs.AI ↗ · 2026-06-04 缓存

本文介绍了 PEEL（AI 认识参与素养协议）框架，该框架将 Voyant Tools 的确定性文本分析与 Claude 的大语言模型解释相结合，以皮尔斯符号学为理论基础，旨在揭示 AI 生成的研究摘要中的系统性失真，并促进认识论层面的问责。

0 人收藏 0 人点赞

#text-analysis

基于研究者指定协变量的LLM文本分析的条件假设生成

arXiv cs.CL ↗ · 2026-06-03 缓存

本文介绍了条件假设生成（Conditional Hypothesis Generation），这是一个结合研究者指定协变量的框架，用于引导基于LLM的文本分析发现有意义的子组差异，同时解决诸如层不平衡和符号反转等混杂因素。

0 人收藏 0 人点赞

#text-analysis

口号还是立场？面向中国国企演讲中创业话语测量的轻标注诊断方法

arXiv cs.CL ↗ · 2026-05-29 缓存

本文提出了一种轻标注测量诊断方法，用于评估流行的文本分析方法（词典、主题模型、词嵌入、大语言模型）在创业话语测量中捕捉实质性立场与象征性修辞的能力。研究使用了80场中国国企演讲语料库，并利用同一公司不同演讲者配对的自然实验。作者发现，零样本大语言模型表现出更高的敏感性，但效应中相当一部分可能源于演讲者个人语言风格而非实质性立场。

0 人收藏 0 人点赞

#text-analysis

Granuscore：一种用于文本分析和问答的无参考粒度度量

arXiv cs.CL ↗ · 2026-05-27 缓存

Granuscore是一种用于文本分析和问答的无参考粒度度量。它利用分层嵌入空间来捕捉细粒度与粗粒度语言，并在QA基准测试中展示了模型行为的一致差异。

0 人收藏 0 人点赞

#text-analysis

机器生成文本中隐藏的类人本质：理论与检测增强

arXiv cs.CL ↗ · 2026-05-25 缓存

本文揭示了机器生成文本中隐藏的类人片段的存在，并提出了一种与模型无关的堆叠增强框架，通过减少这些片段的影响来改进现有检测器。

0 人收藏 0 人点赞

#text-analysis

并行LLM推理实现抗偏差、稳健的概念抽象

arXiv cs.CL ↗ · 2026-05-21 缓存

本文提出了一种并行分块处理长文档的框架，利用LLMs减少累积偏差并提高证据可追溯性，显著降低了遗漏错误和无依据主张。

0 人收藏 0 人点赞

#text-analysis

Embeddings 用于偏好，而非语义

arXiv cs.AI ↗ · 2026-05-12 缓存

本文介绍了一种新的 embedding 模型，旨在捕捉偏好相似性，而不仅仅是语义相似性，从而提高了集体决策系统中的偏好预测能力。

0 人收藏 0 人点赞

#text-analysis

马尔可夫再读普希金：一场关于《叶甫盖尼·奥涅金》诗性世界的统计之旅

arXiv cs.CL ↗ · 2026-04-23 缓存

研究者用四态马尔可夫链对普希金《叶甫盖尼·奥涅金》及其意大利译本中的元音/辅音模式建模，揭示结构不对称与叙事相关的音韵线索。

0 人收藏 0 人点赞

#text-analysis

# 弥合社区需求与媒体内容差距的洞察来源：[https://arxiv.org/html/2604.16651](https://arxiv.org/html/2604.16651) ## 移民之声与地方新闻：弥合社区需求与媒体内容差距的洞察作者：Paula Dolores Rescala [paula\.rescala@epfl\.ch](https://arxiv.org/html/2604.16651v1/mailto:[email protected])，EPFL 瑞士 Victor Bros [vbros@idiap\.ch](https://arxiv.org/html/2604.16651v1/mailto:[email protected])，Idiap Research Institute 及 EPFL 瑞士与 Daniel Gatica

0 人收藏 0 人点赞

text-analysis

提交意见反馈