reliability-analysis

标签

Cards List
#reliability-analysis

LLM辅助的科学话语立场检测:以贝叶斯认知科学为案例研究

arXiv cs.CL · 2026-06-16 缓存

本文提出了一种利用LLM进行科学话语立场检测的方法,具体用于识别贝叶斯认知科学文章中现实主义与工具主义的对立立场。该方法结合了理论驱动编码、专家标注和提示优化,实现了高可靠性。

0 人收藏 0 人点赞
#reliability-analysis

当存储证据不再可用时:Agent 记忆的条件规模评估

arXiv cs.AI · 2026-05-11 缓存

本文提出了一种针对 Agent 记忆的条件规模评估协议,分析随着无关会话的累积,可靠性如何下降。该研究识别了不同记忆接口和大型语言模型(LLM)下的特定失效区域和可用规模边界。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈