标签
本文分析了LLM赋能代理工作流中延迟、可靠性和成本之间的权衡,引入了性能模型,并推导出了如注水令牌分配等最优资源分配策略。
本文介绍了可计算公平分配(CFD)框架,该框架利用Boltzmann-Softmax控制在AI资源分配中平衡效率与公平性,并通过AHC++实现实时自适应。
本文介绍了CAST,一种多项式时间近似算法,用于在传播网络中战略性地分配HIV治疗资源给病毒未抑制个体,以最小化新感染,在真实网络上优于现有基线。
本文提出了一种面向循环智能制造的边缘AI驱动分散式任务分配框架,该框架利用学习排序方法来匹配赢家选择的排序性质。仿真结果表明,在高负载和紧截止期限场景下,延迟、截止时间满足率和能源效率均得到改善。
本文探讨了企业中 token 预算这一新兴趋势,强调随着 AI 代理消耗大量计算资源,需要新的管理工具。文章指出,这将创造出一个初创企业机会,即提供软件解决方案以对代理式支出进行可视化和控制。