@askalphaxiv: “Probabilistic Tiny Recursive Model” 本文通过在测试时添加高斯噪声使Tiny Recursive Models随机化…

X AI KOLs Timeline 2026/05/21 22:17 论文

tiny-recursive-models stochastic-inference gaussian-noise ppbench sudoku test-time-augmentation reasoning

摘要

本文介绍了一种方法，通过在测试时添加高斯噪声并进行并行推理，使Tiny Recursive Models随机化，在不重新训练的情况下，在PPBench和Sudoku-Extreme上取得了显著的性能提升。

“Probabilistic Tiny Recursive Model” 本文通过在测试时添加高斯噪声、运行并行推理，并利用已有的Q头选择最佳答案，使Tiny Recursive Models随机化。无需重新训练，无需任务特定技巧，其PPBench从62.6%跃升至91.2%，Sudoku-Extreme从87.4%跃升至98.75%。

查看原文

相似文章

@Xudong07452910: 推荐一本免费的 AI 书：《Agentic AI 漫游指南》。我刚开始读，感觉它和很多「AI 入门指南」不太一样。虽然也有基础知识，但作者明显没有把主要篇幅放在那些已经被反复讲过的概念上，而是一路讲到强化学习 RL、推理 Reason…

X AI KOLs Timeline

推荐一本免费的AI书《Agentic AI 漫游指南》，它深入讲解强化学习、推理、评测等概念，不同于普通入门指南，帮助理解AI工作机制。该书源自arXiv预印本。

@askalphaxiv: “Probabilistic Tiny Recursive Model” 本文通过在测试时添加高斯噪声使Tiny Recursive Models随机化…

相似文章

一直在通过3批评判器流程运行Qwen3.6-27B。这个流程的重要性远超我的想象。

@akshay_pachaar: 现在重要的是框架。模型只是商品。模型本身只返回文本。它产生的任何东西都无法…

Token最小化不等于上下文纪律

Tandem Reinforcement Learning with Verifiable Rewards

提交意见反馈