llm-theory

#llm-theory

基于简洁机器无关轨迹的语言识别

arXiv cs.CL ↗ · 2026-07-15 缓存

本文探讨了Gold-Angluin极限语言识别模型中的开放问题，展示了仅使用小字母表且直接从语言定义的计算轨迹即可实现极限识别，无需底层机器模型。

0 人收藏 0 人点赞

#llm-theory

arXiv cs.CL ↗ · 2026-07-08 缓存

本文正式定义了提示复杂性这一概念，该概念衡量固定语言模型生成目标文本或行为所需的最短合理提示，类比于资源有界的柯尔莫哥洛夫复杂性。

0 人收藏 0 人点赞

#llm-theory

arXiv cs.AI ↗ · 2026-05-12 缓存

本文提出了一个基于自由能视角的框架，以区分大型语言模型后训练中的能力激发与能力创造，论证指出监督微调（SFT）和强化学习（RL）通常是对现有行为进行重新加权，而非创造新行为。

0 人收藏 0 人点赞