feedback-driven

标签

Cards List
#feedback-driven

Verilog-Evolve: 反馈驱动与技能演进的Verilog生成

arXiv cs.CL · 2026-05-27 缓存

Verilog-Evolve 是一个反馈驱动的框架,通过迭代优化大型语言模型生成的 Verilog 代码,利用功能仿真、综合和时序指标促进更优候选方案的选出,并跨任务演进可复用的修复技能。

0 人收藏 0 人点赞
#feedback-driven

FBOS-RL:反馈驱动的双目标协同强化学习

arXiv cs.LG · 2026-05-21 缓存

本文提出FBOS-RL,一个反馈驱动的双目标协同强化学习框架,通过使用反馈引导的探索和两个相互增强的训练目标——面向利用的策略对齐(EPA)和面向探索的能力培养(ECC)——来提升训练效率和性能上限,优于GRPO在大语言模型对齐和推理中的表现。

0 人收藏 0 人点赞
#feedback-driven

FD-NL2SQL:反馈驱动的临床NL2SQL系统,使用中不断改进

arXiv cs.CL · 2026-04-20 缓存

FD-NL2SQL是一个反馈驱动的自然语言转SQL系统,专门用于临床肿瘤学数据库,通过临床医生编辑和基于逻辑的SQL增强实现持续学习。该系统将自然语言问题分解为谓词,检索专家验证的范例,并综合可执行的SQL,具备持续学习能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈