标签
DystopAI是一个本地桌面指挥中心,通过直观的用户界面管理OpenClaw AI智能体。它支持智能体创建、角色分配、调度和多渠道通信,以简化实际工作流。
作者解释了如何构建一个能够在恒定时间内每秒启动数百万个沙箱的计算平台,重点介绍了使用Cassandra和S3进行解耦调度和能力聚合。
EvalStop是一种用于多租户RLHF平台的调度原语,通过监控下游评估分数并在连续下降时终止作业来检测和修正奖励过度优化,实现了98%的精确率和99%的召回率,同时将作业完成时间缩短9%,并将浪费的计算资源减少22%。
在医疗诊所对LuMay语音助手进行30天测试显示,应答可用性提高,患者愿意使用AI进行常规预约,且员工工作量减少。
本文分析了混合批处理与独占批处理在LLM推理中的权衡,表明最优选择取决于GPU内存带宽。提出了一种基于阈值的混合调度器,可在两种方法间动态切换,在带宽受限的GPU上实现高达41.9%的吞吐量提升。
本文提倡在 Linux 上使用 systemd 定时器替代传统的 cron 作业来执行定时任务,强调其更好的集成性、日志记录以及更清晰的语法。
本文全面综述并分类了基于人体通信的联邦学习在体载边缘智能中的应用,并提出了一个名为BODYFED-HBC的调度示例。
本文介绍了飞机拆解调度问题,这是一个大规模组合优化任务,涉及数千个任务、先后关系、平衡约束以及有限空间。本文提出了一个约束规划模型和一个MIP模型,并在包含多达1450个任务的实际运营实例上进行了测试。
本文提出了一种结合动态规划和约束规划的混合方法来解决部分车间调度问题,证明了尽管未超越纯CP求解器,但整合两种范式的可行性。
PALS是一种面向LLM服务的功耗感知运行时,将GPU功率上限视为可控旋钮,与批大小联合优化,以在满足吞吐量目标的同时最大化能效。该系统在功率约束下可将能效提升高达26.3%,并将QoS违规减少4倍至7倍。
Cal.com 团队已将其整个日程安排平台以 cal.diy 的名义开源,采用 MIT 许可证,提供可自行托管的免费方案,与 Calendly 和 SavvyCal 等付费服务竞争。
本文探讨了如何使用 Google OR-Tools CP-SAT 求解器来优化 Akamai 云基础设施的维护调度,解决了涉及容量和并发等复杂约束的问题。
Cal.com 推出 Cal.diy,这是一个完全采用 MIT 许可证的开源社区分支,已移除所有企业级功能,适合个人自托管。