representation

#representation

发展性方法揭示神经语言模型的统计学习：Transformer从最抽象的统计模式中泛化

arXiv cs.CL ↗ · 昨天缓存

本文采用发展性方法研究神经语言模型（特别是Transformer）如何从人工语法中学习统计模式，发现它们首先获取全局抽象统计信息，然后学习局部依赖关系，并在早期出现过度泛化。

0 人收藏 0 人点赞

#representation

更好的AI图像

Hacker News Top ↗ · 昨天缓存

文章强调了陈词滥调和误导性的AI图像问题，并介绍了一个非营利项目，该项目创建并策划更准确、更多样化的AI素材图像。

0 人收藏 0 人点赞

#representation

代理未来的地图

Reddit r/ArtificialInteligence ↗ · 2026-06-17

作者提出了一个‘Agentic Shift’（代理转移），从直接交互转向每个人和每件事物都拥有代理的世界，从委托转向代表，并用一张图表映射了这一转变。

0 人收藏 0 人点赞

#representation

错误编码：多语言语法错误纠正的上下文示例表征检索

arXiv cs.CL ↗ · 2026-06-16 缓存

本文介绍了语法错误表征（GER），一种基于错误模式而非语义相似性检索上下文示例的新方法，显著提升了具有上下文学习能力的大型语言模型在多语言语法错误纠正中的表现。

0 人收藏 0 人点赞

#representation

AI真正的转变并非生产力——而是从直接使用转向代理模式

Reddit r/artificial ↗ · 2026-06-09

文章认为，AI真正的转变不仅仅是生产力提升，而是从直接使用软件转向委托AI代表代为行事，这引发了关于数据亲密性和信任的问题。

0 人收藏 0 人点赞

#representation

量化25年来警务相关死亡新闻报道中的媒体呈现动态

arXiv cs.CL ↗ · 2026-06-08 缓存

本文展示了对加拿大25年来涉及警察的死亡事件新闻报道的最大规模计算分析，引入了一种新模型（PerspectiveGap），该模型量化了媒体叙事中国家官僚视角相对于平民声音的主导地位。

0 人收藏 0 人点赞

#representation

文本到图像模型对文本编码器的依赖比你想象的要少

Hugging Face Daily Papers ↗ · 2026-06-02 缓存

本文证明，文本到图像的扩散Transformer模型主要依赖文本编码器中的标记合并和词序，而非完整的上下文嵌入，表明图像模型本身能够解码复杂的语言结构。

0 人收藏 0 人点赞

#representation

LLM交易代理中的表示特征与风险反馈对齐

arXiv cs.LG ↗ · 2026-05-29 缓存

本文研究了LLM代理在金融交易中的行为对齐与表示动态，介绍了TradeArena测试平台，并发现规划嵌入中存在可测量的故障前特征，这些特征能在多种前沿模型与压力条件下高精度预测回撤。

0 人收藏 0 人点赞

#representation

向量并非中性：从导出的大语言模型表征中推断敏感信息——以摘要生成为例

arXiv cs.CL ↗ · 2026-05-27 缓存

本文探讨了在临床摘要生成中从导出的大语言模型表征推断敏感信息的风险，表明减少一个向量工件的泄露并不能保证其他工件的隐私。提出了SurfaceLoRA，一种微调方法，可在保持效用的同时减少从目标向量中恢复种族信息的能力。

0 人收藏 0 人点赞

#representation

光鲜故事，隐痛暗藏：以大语言模型为视角探究残疾表征

arXiv cs.CL ↗ · 2026-05-21 缓存

通过模拟残疾人士视角的社交媒体帖子，研究大语言模型如何呈现残疾，发现LLM常常产生过于正面的刻板印象，未能真实反映实际体验。

0 人收藏 0 人点赞

#representation

AI可能重塑机构而非取代工作

Reddit r/artificial ↗ · 2026-05-12

文章认为，下一场重大AI辩论应聚焦于代表性和机构架构，提出三个层次（感知、核心、驱动）来应对AI系统如何捕获现实、推理及合法行动的问题，而非仅仅模拟智能。

0 人收藏 0 人点赞

#representation

留在房间里的伦理

Reddit r/artificial ↗ · 2026-04-22 缓存

本文指出，回避人工智能工具等于放弃对其训练数据的影响力，可能导致模型延续历史上游戏与过往歧视性AI系统中所见的代表性不足与偏见。

0 人收藏 0 人点赞

representation

提交意见反馈