automated-curation

标签

Cards List
#automated-curation

Mask-Proof: 一种基于LLM的数学证明自动化数据梳理流水线

arXiv cs.AI · 昨天 缓存

介绍Mask-Proof,一种基于LLM的流水线,可将数学证明转化为掩码步骤任务用于自动评估,并呈现MaskProofBench,一个包含292个精选问题的基准测试,与专家标注者的一致性达到96.8%。

0 人收藏 0 人点赞
#automated-curation

MIND-Skill:通过多智能体归纳与演绎实现质量保证的技能生成

arXiv cs.AI · 2026-05-12 缓存

MIND-Skill 是本研究论文提出的一种新框架,它利用基于 TextGrad 优化的多智能体归纳和演绎,自动化生成高质量、可复用的智能体技能,并提供质量保证。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈