标签
TaxDistill提出了一种知识蒸馏框架,使用拥有5亿参数的基因组基础模型(GenomeOcean)作为教师模型,通过减少相似性搜索工具带来的标签噪声来改进宏基因组分类注释,在CAMI2数据集上实现了显著的F1分数提升。