thompson-sampling

#thompson-sampling

Randomized Exploration for Linear Bandits via Absolute Perturbations

arXiv cs.LG ↗ · 4d ago Cached

This paper proposes Absolute Thompson Sampling (ATS), a modification of Thompson Sampling that ensures optimism in expectation by using absolute exploration noise, enabling a simpler UCB-style regret analysis while maintaining computational efficiency. It achieves regret matching existing TS bounds, and introduces an ensemble variant that converges to UCB behavior.

0 favorites 0 likes

#thompson-sampling

Structured Neuron Pruning in Deep Neural Networks Using Multi-Armed Bandits

arXiv cs.LG ↗ · 2026-06-09 Cached

This paper proposes a novel structured neuron pruning framework for deep neural networks using multi-armed bandit algorithms, demonstrating effectiveness on various tasks.

0 favorites 0 likes

#thompson-sampling

Mango: Multi-Agent Web Navigation via Global-View Optimization

arXiv cs.CL ↗ · 2026-04-22 Cached

Purdue researchers introduce Mango, a multi-agent web navigation system that uses global site structure and Thompson Sampling to pick optimal starting URLs, boosting success rates on WebVoyager and WebWalkerQA benchmarks.

0 favorites 0 likes

thompson-sampling

Randomized Exploration for Linear Bandits via Absolute Perturbations

Structured Neuron Pruning in Deep Neural Networks Using Multi-Armed Bandits

Mango: Multi-Agent Web Navigation via Global-View Optimization

Submit Feedback