标签
EvoOptiGraph是一个框架,用于从自然语言自动进行优化建模,使用基于图的进化生成来创建多样化的训练数据,并通过弱点驱动的强化学习共同进化模型,在多个基准测试上取得了最先进的结果。
StarOR 提出了一种框架,将蒙特卡洛树搜索与测试时强化学习协同用于自动优化建模,在多个基准测试中取得了最先进的性能。