标签
介绍了 MINARD,一个从科学图表及其论文生成带旁白、区域定位的讲解视频的流水线,以及 FigTalk 基准和新的定位指标。
这是一个将科学论文图表自动转化为可执行Python绘图代码的工具,利用Qwen视觉模型和Codex agent进行面板分割、代码生成和精修。