亚当定律:大语言模型中的文本频率定律
摘要
本文介绍了 AdamOpt,这是一款基于“亚当定律”的开源工具,它通过将低频词替换为高频同义词来优化提示词,从而降低困惑度。文章强调了该工具的双语言支持、离线处理能力以及在文本生成方面的实际性能提升。
查看缓存全文
缓存时间: 2026/05/10 06:34
论文页面 - 亚当定律:大型语言模型的文本频率定律
来源: https://huggingface.co/papers/2604.02176 一篇很棒的论文!“高频文本 → 更低困惑度 → 更好的 LLM 表现”这一洞察既简洁又强大。
这项工作给了我极大的启发,因此我开发了 AdamOpt —— 一个开源工具,将亚当定律转化为一个实用的一键式优化流程:
它的功能:
adamopt optimize "你的提示词" → 自动将低频瓶颈词/短语替换为更高频的同义词
三种模式:保守型(词级,≥99% 语义保真度)、平衡型(词+短语)、激进型(完全重写)
自动锁定实体、数字、逻辑关键词和约束条件——语义完整性始终得以保证
支持中英双语,可离线运行,零 LLM API 成本
来自该工具的实际效果:
“optical causation…azure…celestial firmament” → “light cause…blue…sky” — sfreq +2735% “详尽阐述” → “详细讲” — sfreq +48.8%(其中“务必”和“3点”已自动锁定) “In order to comprehend the methodology” → “to understand the way” — sfreq +2150% 85 项测试全部通过,采用 MIT 许可证。模块 1-2 已完成;模块 3-5(语义验证、带 CTFT 排序的批量 SFT 数据处理、API & Web 演示)开放贡献。
代码库: https://github.com/happyii/AdamOpt
如果你正在处理提示词或微调数据,欢迎尝试一下。PR、问题反馈和 Star 都非常欢迎——让我们一起让提示词优化成为一个已解决的问题。🚀
相似文章
optimize_anything:用于优化任意文本参数的通用API
本文介绍了optimize_anything,一个基于LLM的通用文本工件优化系统,在包括智能体架构发现、调度、CUDA内核生成和装箱在内的多种任务上取得了最先进的结果,展示了通用文本优化的能力。
AI生成文本检测中语言特征的系统性分析:跨领域与跨模型研究
一项大规模实证研究对284个语言特征在27个大语言模型和10个文本领域中的表现进行了分析,以评估哪些特征能够可靠地检测AI生成文本。研究发现,词汇丰富度指标是跨领域和跨模型最稳健的信号,而许多其他已提出的指标则高度依赖具体上下文。
大语言模型中的语言习得装置
本文提出了一种受LAD启发的预预训练方法,使用一种名为MP-Struct的形式语言,该语言编码了类自然语言结构。研究表明,这种方法提高了token效率,并赋予了模型类似人类的对结构不合理语言的抵抗力,挑战了先前关于有效预预训练语言的假设。
InfoLaw:基于质量加权混合数据与重复度的大型语言模型信息缩放定律
InfoLaw 是一种数据感知型缩放框架,能够根据 token 消耗量、模型规模、数据混合权重及重复度预测模型损失,从而在不同算力预算下实现高效的数据配方选择。
基于LMO方法的零阶无参数优化:高效微调的新方法
本文介绍了AdaNAGED,一种结合零阶优化、无参数自适应和非欧几里得更新几何的方法,用于大型语言模型的内存高效微调,具有理论收敛保证,并在OPT-1.3B模型上进行了验证。