标签
介绍轨迹外推误差,这是一种从变换器语言模型隐藏状态导出的度量,它独立于惊讶度且与其正交地预测人类阅读时间,揭示了增量处理成本中一个可分离的成分。
本文研究了大语言模型如何因对话上下文而产生不同结果,发现话题而非明确的用户人口特征是导致高风险场景(如薪资建议)中差异的主要驱动因素。
一项新研究揭示,意大利和荷兰成年人在教导儿童时会本能地以类似方式调整手势,这表明跨文化存在一种共享的沟通策略。
本文测试了解析多重性不匹配假说,该假说认为语言模型之所以低估了人类在花园路径句中的处理困难,是因为它们能同时考虑更多的句法解析。通过使用带束搜索的循环神经网络语法(RNNGs),研究者发现减少活跃解析的数量会增大预测的花园路径效应,但远远不足以完全捕捉人类数据。
本文探讨了人类在严格词汇限制下如何进行交流,将其增量生成策略与使用大语言模型进行顺序蒙特卡洛推断的贪婪和全局最优采样算法进行比较。