enterprise-applications

#enterprise-applications

Towards Scalable Customization and Deployment of Multi-Agent Systems for Enterprise Applications

arXiv cs.CL ↗ · 3d ago Cached

This paper proposes a unified framework for customizing and deploying LLM-based multi-agent systems in enterprise settings, combining model customization through continual pretraining, fine-tuning, and preference optimization with inference optimization using speculative decoding and FP8 quantization. It achieves 4.48x throughput speedup while maintaining performance on enterprise workloads.

0 favorites 0 likes

enterprise-applications

Towards Scalable Customization and Deployment of Multi-Agent Systems for Enterprise Applications

Submit Feedback