标签
本文采用发展性方法研究神经语言模型(特别是Transformer)如何从人工语法中学习统计模式,发现它们首先获取全局抽象统计信息,然后学习局部依赖关系,并在早期出现过度泛化。
作者提出了一个‘Agentic Shift’(代理转移),从直接交互转向每个人和每件事物都拥有代理的世界,从委托转向代表,并用一张图表映射了这一转变。
本文介绍了语法错误表征(GER),一种基于错误模式而非语义相似性检索上下文示例的新方法,显著提升了具有上下文学习能力的大型语言模型在多语言语法错误纠正中的表现。
文章认为,AI真正的转变不仅仅是生产力提升,而是从直接使用软件转向委托AI代表代为行事,这引发了关于数据亲密性和信任的问题。
本文展示了对加拿大25年来涉及警察的死亡事件新闻报道的最大规模计算分析,引入了一种新模型(PerspectiveGap),该模型量化了媒体叙事中国家官僚视角相对于平民声音的主导地位。
本文证明,文本到图像的扩散Transformer模型主要依赖文本编码器中的标记合并和词序,而非完整的上下文嵌入,表明图像模型本身能够解码复杂的语言结构。
本文研究了LLM代理在金融交易中的行为对齐与表示动态,介绍了TradeArena测试平台,并发现规划嵌入中存在可测量的故障前特征,这些特征能在多种前沿模型与压力条件下高精度预测回撤。
本文探讨了在临床摘要生成中从导出的大语言模型表征推断敏感信息的风险,表明减少一个向量工件的泄露并不能保证其他工件的隐私。提出了SurfaceLoRA,一种微调方法,可在保持效用的同时减少从目标向量中恢复种族信息的能力。
通过模拟残疾人士视角的社交媒体帖子,研究大语言模型如何呈现残疾,发现LLM常常产生过于正面的刻板印象,未能真实反映实际体验。
文章认为,下一场重大AI辩论应聚焦于代表性和机构架构,提出三个层次(感知、核心、驱动)来应对AI系统如何捕获现实、推理及合法行动的问题,而非仅仅模拟智能。
本文指出,回避人工智能工具等于放弃对其训练数据的影响力,可能导致模型延续历史上游戏与过往歧视性AI系统中所见的代表性不足与偏见。