iterative-refinement

标签

Cards List
#iterative-refinement

KForge:面向AI加速器的LLM驱动跨平台内核生成

arXiv cs.LG · 4天前 缓存

KForge是一个跨平台框架,利用两个协作的基于LLM的智能体,自动生成和优化适用于多种AI加速器的高性能计算内核,在NVIDIA B200和Intel Arc B580硬件上实现了显著的加速效果。

0 人收藏 0 人点赞
#iterative-refinement

当LLM奖励设计失败:稀疏结构化强化学习的诊断驱动细化

arXiv cs.LG · 2026-05-29 缓存

本文将LLM生成的奖励塑形视为稀疏结构化强化学习中的调试问题,识别出奖励泛滥和语义误解等失败模式。作者提出诊断驱动的迭代细化,与一次性生成相比,取得了显著的成功率提升(例如,DoorKey-8×8从2.3%提升至97.6%)。

0 人收藏 0 人点赞
#iterative-refinement

迭代细化神经算子是一种学习的固定点求解器:缓解频谱偏差的理论方法

arXiv cs.LG · 2026-05-26 缓存

本文介绍了迭代细化神经算子(IRNO),它通过固定点迭代应用学习到的细化模块来增强预训练的神经算子,以缓解频谱偏差。IRNO逐步修正高频误差,在湍流上实现了高达56%的改进,并且在超过训练迭代次数时仍能稳定外推。

0 人收藏 0 人点赞
#iterative-refinement

RMA:面向研究级数学问题的智能体系统

arXiv cs.AI · 2026-05-25 缓存

Research Math Agents (RMA) 是一个用于研究级数学问题自动推理的智能体框架,在 First Proof 基准测试中取得最先进结果,解决了10个问题中的8个,优于 GPT-5.2R 和 Aletheia 等强基线。

0 人收藏 0 人点赞
#iterative-refinement

面向异构大语言模型多智能体系统的迭代式批评与路由控制器

arXiv cs.AI · 2026-05-12 缓存

本文介绍了一种用于多智能体大语言模型系统的批评与路由控制器,将协调过程建模为序贯决策问题。该方法利用策略梯度优化控制器以实现迭代优化,在表现优于基线方法的同时,降低了对顶级模型的依赖。

0 人收藏 0 人点赞
#iterative-refinement

解决循环:用于语言和推理的吸引子模型

Hugging Face Daily Papers · 2026-05-12 缓存

本文介绍了吸引子模型,该模型利用定点求解和隐式微分进行高效的迭代优化,在降低计算成本的同时,实现了相较于传统Transformer更优的语言建模和推理性能。

0 人收藏 0 人点赞
#iterative-refinement

递归推理系统的状态表示与终止条件

arXiv cs.AI · 2026-05-11 缓存

本文提出了一种用于递归推理系统的认知状态图表示方法以及一种基于顺序间隙的终止标准,旨在解决如何管理不断演变的推理状态以及何时停止迭代的问题。

0 人收藏 0 人点赞
#iterative-refinement

WiCER:面向 LLM Wiki 系统的 Wiki 记忆编译、评估与精炼迭代式知识编译

arXiv cs.CL · 2026-05-11 缓存

本文介绍了 WiCER,这是一种将领域知识编译到 LLM Wiki 系统中的迭代算法,旨在最大限度地减少知识蒸馏过程中的信息丢失和灾难性失败率。研究表明,与盲编译方法相比,该方法通过更好地保留关键事实,改进了全上下文 KV 缓存推理的效果。

0 人收藏 0 人点赞
#iterative-refinement

GPT-Image-2 现在会自行审查输出,并不断迭代,直到对输出结果的正确性满意为止。

Reddit r/singularity · 2026-04-21

这张图片的生成耗时约 11 分钟,期间它多次对自身输出进行审查和迭代。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈