contamination-aware

标签

Cards List
#contamination-aware

Multi-LCB:将LiveCodeBench扩展到多种编程语言

Hugging Face Daily Papers · 2026-06-18 缓存

Multi-LCB 将 LiveCodeBench 基准扩展到十二种编程语言,以评估大型语言模型,同时保留污染控制机制,揭示了 Python 过拟合和语言特定的污染问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈