knowledge-regulation

#knowledge-regulation

Metacognition as Reward: Reinforcing LLM Reasoning via Knowledge and Regulation Signals

arXiv cs.CL ↗ · 2026-05-25 Cached

Introduces Metacognition-as-Reward (MaR), a reinforcement learning framework that guides LLM reasoning via metacognitive knowledge and regulation signals, achieving up to 11% improvement over vanilla methods on reasoning benchmarks.

0 favorites 0 likes

knowledge-regulation

Metacognition as Reward: Reinforcing LLM Reasoning via Knowledge and Regulation Signals

Submit Feedback