korean

标签

Cards List
#korean

K-BrowseComp:基于韩国语境的网络浏览智能体基准测试

Hugging Face Daily Papers · 2026-06-01 缓存

介绍了K-BrowseComp,一个包含400个问题的韩国网络浏览智能体基准测试,揭示了与英文基准测试相比存在的显著性能差距,并强调了开发强健的韩国人工智能的必要性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈