llm-code-generation

标签

Cards List
#llm-code-generation

Metal-Sci:用于 Apple Silicon 上 LLM 驱动演化内核搜索的科学计算基准

Hugging Face Daily Papers · 2026-05-10 缓存

Metal-Sci 推出了一项包含 10 个任务的基准测试,用于优化 Apple Silicon 上的科学计算内核,并配套了由大语言模型驱动的演化搜索框架。该研究评估了 Claude Opus 4.7、Gemini 3.1 Pro 和 GPT 5.5 等模型,在实现显著加速的同时,利用分布外测试来捕获静默的性能退化问题。

0 人收藏 0 人点赞
#llm-code-generation

KernelBench-X:评估LLM生成GPU内核的综合基准测试

Hugging Face Daily Papers · 2026-05-06 缓存

KernelBench-X是一个用于评估LLM生成GPU内核的新基准,揭示了任务结构对正确性的影响大于方法设计,且正确性并不保证硬件效率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈