differentiable-optimization

#differentiable-optimization

dMX: Differentiable Mixed-Precision Assignment for Low-Precision Floating-Point Formats

arXiv cs.LG ↗ · 2026-06-04 Cached

dMX is a differentiable mixed-precision quantization framework that learns optimal floating-point bit-width assignments per layer for LLMs, targeting the MXFP family of formats defined by the OCP standard. It uses continuous optimization with temperature-based annealing and a budget-aware regularization term, consistently outperforming KL-divergence heuristics on Llama, Qwen3, and SmolLM2 models.

0 favorites 0 likes

#differentiable-optimization

DisjunctiveNet: Neural Symbolic Learning via Differentiable Convexified Optimization Layers

arXiv cs.LG ↗ · 2026-06-01 Cached

Introduces DisjunctiveNet, a unified end-to-end framework for enforcing hard, input-dependent mixed integer linear constraints within neural networks via differentiable convexified optimization layers, achieving perfect rule satisfaction on real-world datasets.

0 favorites 0 likes

#differentiable-optimization

Graph Normalization: Fast Binarizing Dynamics for Differentiable MWIS

arXiv cs.LG ↗ · 2026-05-08 Cached

Introduces Graph Normalization, a differentiable dynamical system for approximating Maximum Weight Independent Set, with convergence guarantees and applications in structured sparse attention and constrained optimization.

0 favorites 0 likes

differentiable-optimization

dMX: Differentiable Mixed-Precision Assignment for Low-Precision Floating-Point Formats

DisjunctiveNet: Neural Symbolic Learning via Differentiable Convexified Optimization Layers

Graph Normalization: Fast Binarizing Dynamics for Differentiable MWIS

Submit Feedback