prompt-optimization

#prompt-optimization

测量AI的忠实度——无论好坏

Reddit r/AI_Agents ↗ · 2026-05-20

本文讨论了LLM优化中忠实度的重要性，引入了一种结构忠实度分数，通过测量词汇重叠、约束保留和任务类型匹配的漂移，确保提示优化不牺牲意图。

0 人收藏 0 人点赞

#prompt-optimization

MOCHA: 基于切比雪夫退火的多目标智能体技能优化

arXiv cs.AI ↗ · 2026-05-20 缓存

MOCHA 提出了一种面向 LLM 智能体技能的多目标优化方法，通过切比雪夫标量化和指数退火策略来应对严格的平台约束，发现帕累托最优变体，相较于现有优化器取得了显著改进。

0 人收藏 0 人点赞

#prompt-optimization

基于 TIDE 的稳健议论文理解：一种融合试炼与辩论的交互框架

arXiv cs.AI ↗ · 2026-05-19 缓存

本文介绍了 TIDE，一种新颖的框架，它整合了试炼与辩论机制，以改善基于标准的提示优化，用于议论文理解任务，如自动作文评分、论证成分检测和论证关系识别。实验结果显示性能提升，突显了结合基于提示的方法进行鲁棒论证分析的潜力。

0 人收藏 0 人点赞

#prompt-optimization

@aman2304: 论文被KDD 2026接收！我们正在使用自动化提示优化和评估构建前沿智能体！一如既往…

X AI KOLs Following ↗ · 2026-05-18 缓存

一篇关于使用自动化提示优化和评估构建前沿智能体的论文已被KDD 2026接收。

0 人收藏 0 人点赞

#prompt-optimization

@MaximeRivest: https://x.com/MaximeRivest/status/2055293570119065875

X AI KOLs Following ↗ · 2026-05-15 缓存

MaximeRivest解释了DSPy的五个核心组件——Optimizers、Signatures、LMs、Modules和Adapters——并认为有效的AI工程需要掌握这些要素，同时强调了结构化输出渲染这一常常被忽视的作用。

0 人收藏 0 人点赞

#prompt-optimization

PEML：面向优化连续提示的参数高效多任务学习

arXiv cs.CL ↗ · 2026-05-15 缓存

PEML提出了一种参数高效的多任务学习方法，通过低秩自适应共同优化连续提示和模型权重。在多个基准测试上，平均准确率提升高达6.67%。

0 人收藏 0 人点赞

#prompt-optimization

Poetiq：递归自我改进实现新的SOTA编码性能

Reddit r/singularity ↗ · 2026-05-15 缓存

Poetiq的Meta-System通过标准API访问进行递归自我改进，无需微调，在LiveCodeBench Pro编码基准测试上取得了新的SOTA结果，超越了GPT 5.5等领先模型。

0 人收藏 0 人点赞

#prompt-optimization

持续增强框架：面向自我改进基础智能体的在线适应

Hugging Face Daily Papers ↗ · 2026-05-11 缓存

本文介绍了“持续增强框架”（Continual Harness），该框架使具身人工智能智能体能够在无需重置环境的情况下实现在线自我改进。研究展示了在《宝可梦》游戏中的显著进展，通过自动化提示词和技能优化，智能体达到了人类水平的表现。

0 人收藏 0 人点赞

#prompt-optimization

@learnwithella：Claude Code 的自进化技能简直离谱一次循环 → 10 次测试，按评估打分，重写提示词，再测试，保留胜者……

X AI KOLs Timeline ↗ · 2026-04-22 缓存

Claude Code 可通过运行评估、自动重写提示词并保留最优结果，实现提示词自迭代，让“钩子文案”技能一夜之间从 32/50 飙到 47/50。

0 人收藏 0 人点赞

#prompt-optimization

@shawntenam：GEPA（http://github.com/gepa-ai/gepa）通过自动优化提示指令，把 Haiku 4.5 的通过率从 65% 提升到 85%

X AI KOLs Timeline ↗ · 2026-04-20

GEPA 是一款开源工具，可基于执行轨迹和评分自动优化提示指令，无需更换模型，就能将 Claude Haiku 4.5 的通过率从 65% 提升到 85%。

0 人收藏 0 人点赞

#prompt-optimization

@DSPyOSS：说到底就是签名（规范）、模块（“测试台”、“推理扩展”）和优化器（学习算法…

X AI KOLs Following ↗ · 2026-04-20 缓存

一篇回顾 DSPy 框架架构的帖子，该框架围绕签名、模块和优化器构建，并指出它自 2022 年以来仍在持续增长。

0 人收藏 0 人点赞

#prompt-optimization

跨异构任务的自演化LLM记忆抽取

Hugging Face Daily Papers ↗ · 2026-04-13 缓存

研究者推出BEHEMOTH基准与CluE聚类提示优化，使LLM能从多样化任务中抽取并保留异构记忆，相比既往自演化框架提升9%。

0 人收藏 0 人点赞

#prompt-optimization

亚当定律：大语言模型中的文本频率定律

Papers with Code Trending ↗ · 2026-04-02 缓存

本文介绍了 AdamOpt，这是一款基于“亚当定律”的开源工具，它通过将低频词替换为高频同义词来优化提示词，从而降低困惑度。文章强调了该工具的双语言支持、离线处理能力以及在文本生成方面的实际性能提升。

0 人收藏 0 人点赞

#prompt-optimization

多模块 GRPO：组合策略梯度与提示优化的语言模型程序方法

Papers with Code Trending ↗ · 2025-08-06 缓存

本文提出 mmGRPO，一种多模块扩展的群体相对策略优化（GRPO）方法，通过优化语言模型调用和提示来提升模块化 AI 系统的准确率。实验表明，该方法在各类任务上平均带来 11% 的准确率提升，并在 DSPy 中提供了开源实现。

0 人收藏 0 人点赞

#prompt-optimization

GEPA：反思式提示演化可超越强化学习

Papers with Code Trending ↗ · 2025-07-25 缓存

GEPA 是一款提示优化器，利用自然语言反思从试错中学习，在多个任务中，以多达 35 倍的更少 rollout 次数超越了 GRPO 和 MIPROv2 等强化学习方法。

0 人收藏 0 人点赞

#prompt-optimization

自监督提示优化

Papers with Code Trending ↗ · 2025-02-07 缓存

本文提出了一种名为自监督提示优化（SPO）的框架，该框架通过输出对比来优化大语言模型的提示词，无需外部参考，显著降低了成本和数据需求。

0 人收藏 0 人点赞

#prompt-optimization

EvoMap/evolver

GitHub Trending (daily) ↗ · 2026-04-20 缓存

Evolver 是一个由 GEP 驱动的 AI 代理自演化引擎，可自动化提示词优化并创建可审计、可复用的演化资产。该项目正从完全开源过渡到源代码可用，同时保持与现有 MIT 和 GPL-3.0 版本的向后兼容性。

0 人收藏 0 人点赞

prompt-optimization

提交意见反馈