llm-code-generation

#llm-code-generation

Metal-Sci：用于 Apple Silicon 上 LLM 驱动演化内核搜索的科学计算基准

Hugging Face Daily Papers ↗ · 2026-05-10 缓存

Metal-Sci 推出了一项包含 10 个任务的基准测试，用于优化 Apple Silicon 上的科学计算内核，并配套了由大语言模型驱动的演化搜索框架。该研究评估了 Claude Opus 4.7、Gemini 3.1 Pro 和 GPT 5.5 等模型，在实现显著加速的同时，利用分布外测试来捕获静默的性能退化问题。

0 人收藏 0 人点赞

#llm-code-generation

KernelBench-X：评估LLM生成GPU内核的综合基准测试

Hugging Face Daily Papers ↗ · 2026-05-06 缓存

KernelBench-X是一个用于评估LLM生成GPU内核的新基准，揭示了任务结构对正确性的影响大于方法设计，且正确性并不保证硬件效率。

0 人收藏 0 人点赞

llm-code-generation

Metal-Sci：用于 Apple Silicon 上 LLM 驱动演化内核搜索的科学计算基准

KernelBench-X：评估LLM生成GPU内核的综合基准测试

提交意见反馈