标签
本文提出Representation Curriculum (RC),一种训练时干预方法,通过分阶段利用特征来减少对曝光混杂历史信号的过度依赖,并改善排序系统中的冷启动泛化能力。该方法经过了理论分析,并在公开基准和大规模eBay搜索实验中得到了验证。
关于AI智能体应如何处理用户上下文的讨论:是主动告知还是逐步学习,现有的方法如项目记忆和聊天摘要均存在不足。
提出CausalPOI,一个基于时空图的因果表示学习框架,用于冷启动POI签到预测,在真实世界的SafeGraph数据集上显著优于现有最先进基线。
PaperFlow是一个用于科学论文推荐的框架,通过三个阶段的协同运作:画像(Profiling)、推荐(Recommending)和自适应(Adapting),处理用户画像、每日论文流及兴趣漂移。该框架在包含24位用户和50个每日论文流的纵向基准上进行了评估。
本文介绍了用于短期租赁动态定价的人类参与循环门控老虎机(HITL-GB),表明先前策略下的历史定价数据在结构上等同于在线策略预热数据,将冷启动从约150轮减少到约30轮。
Browser Use 推出全新浏览器基础设施服务,具备亚秒级冷启动、更低成本(每小时0.02美元)以及无限扩展能力,现已面向开发者上线。
讨论了AI个性化中的冷启动问题,即新产品缺乏用户数据,并提出了一种经用户同意且由用户拥有的统一用户数据API作为潜在解决方案。
Modal解释了如何使用云缓冲区、自定义文件系统、检查点/恢复以及CUDA检查点/恢复,将AI推理冷启动速度提升40倍,并将云缓冲区管理框架化为一个线性优化问题,用GLOP求解。
TopoPrimer 是一个框架,通过将全局拓扑结构集成到现有模型中,提升了预测准确度,在诸如季节性峰值和冷启动等具有挑战性的场景中显示出显著提升。