标签
本文提出了一种利用LLM进行科学话语立场检测的方法,具体用于识别贝叶斯认知科学文章中现实主义与工具主义的对立立场。该方法结合了理论驱动编码、专家标注和提示优化,实现了高可靠性。
本文提出了一种针对 Agent 记忆的条件规模评估协议,分析随着无关会话的累积,可靠性如何下降。该研究识别了不同记忆接口和大型语言模型(LLM)下的特定失效区域和可用规模边界。