feedback-driven

#feedback-driven

Verilog-Evolve: 反馈驱动与技能演进的Verilog生成

arXiv cs.CL ↗ · 2026-05-27 缓存

Verilog-Evolve 是一个反馈驱动的框架，通过迭代优化大型语言模型生成的 Verilog 代码，利用功能仿真、综合和时序指标促进更优候选方案的选出，并跨任务演进可复用的修复技能。

0 人收藏 0 人点赞

#feedback-driven

arXiv cs.LG ↗ · 2026-05-21 缓存

本文提出FBOS-RL，一个反馈驱动的双目标协同强化学习框架，通过使用反馈引导的探索和两个相互增强的训练目标——面向利用的策略对齐（EPA）和面向探索的能力培养（ECC）——来提升训练效率和性能上限，优于GRPO在大语言模型对齐和推理中的表现。

0 人收藏 0 人点赞

#feedback-driven

arXiv cs.CL ↗ · 2026-04-20 缓存

FD-NL2SQL是一个反馈驱动的自然语言转SQL系统，专门用于临床肿瘤学数据库，通过临床医生编辑和基于逻辑的SQL增强实现持续学习。该系统将自然语言问题分解为谓词，检索专家验证的范例，并综合可执行的SQL，具备持续学习能力。

0 人收藏 0 人点赞