deduction

标签

Cards List
#deduction

信息论如何拯救了我的文字游戏

Hacker News Top · 6天前 缓存

文章描述了作者在构建一款纯粹依靠推理而非猜测的文字游戏时的历程,以及信息论如何帮助解决了生成可解谜题的挑战。

0 人收藏 0 人点赞
#deduction

SciR:用于LLMs科学推理的可控基准

arXiv cs.AI · 2026-06-12 缓存

SciR是一种新的可控基准,用于评估LLMs在科学推理方面的能力,包括演绎、归纳和因果溯因,并通过参数控制提取难度和推理难度。测试表明,两个难度轴都会降低所有模型的性能,推理模型(如DeepSeek-R1)在推理方面优于指令模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈