标签
MMAE是一个全面的多任务音频编辑基准,用于评估AI通过自然语言指令精确修改现有音频片段的能力,目前模型准确匹配率低于5%。
MMAE是一个全面的基于指令的音频编辑基准,涵盖多种模态和复杂度级别,揭示了当前模型能力中的显著差距。