标签
ChaosBench-Logic v2是一个包含165个动态系统共40,886个问题的大规模基准测试,用于评估LLM的逻辑推理能力,结果显示即使在最前沿的模型中,在状态转变推理上也接近随机表现,并存在系统性失败模式。
本文讨论了1955年在洛斯阿拉莫斯国家实验室进行的一次计算机实验如何彻底改变了对混沌的理解,该实验很可能指的是费米-帕斯塔-乌拉姆-辛格问题。
介绍QuChaTeR,一种混合架构,结合了小波预处理、混沌映射和变分量子电路与循环结构,用于地震预测,在收敛速度和准确性上优于经典和量子基线。
介绍NormWear-2,一种将多变量生理信号和临床干预编码到共享潜空间的世界模型,利用混沌理论平衡改进长期预测,涵盖日常生活、即时护理和临床环境。
介绍了时间范围约束的Rashomon集,用于表征混沌系统中模型多样性的演化。该框架证明了预测等价性的指数收缩,并开发了决策对齐算法,将决策质量提高了18-34%。