标签
SurF 是一种生成模型,适用于多元不规则采样的时间序列。它利用时间重缩放定理将事件序列转化为独立同分布指数噪声,在多个真实世界基准测试中取得了最先进的结果。
Datadog 发布 Toto 2.0,这是一个开源权重的时间序列基础模型系列,参数规模从 4M 到 2.5B,在三个基准测试上取得了最先进的结果。这些模型展示了时间序列的缩放定律,随着参数数量的增加性能可预测地提升。
本文针对智能导学系统引入了参与度预测,利用425名中学生的交互日志,预测每周练习分钟数和掌握的新技能数量。基于特征的模型相比启发式基线将误差降低了22-33%,为导学-学习者目标设定提供了可解释的模式。
FutureSim按时间顺序回放世界事件,以基准测试AI智能体的长期预测能力,结果发现即使是最优秀的智能体,准确率也仅为25%。
本文突出了 Claude Opus 和 Gemini Pro 在预测基准测试中的性能排名反转,具体取决于模型是自行进行网络搜索还是使用固定的证据。这表明,在研究阶段 Opus 表现出色,而 Gemini 在基于固定证据的判断方面更胜一筹,揭示了标准基准测试与实际部署条件之间的不匹配。
一篇研究论文,提出了一种用于太阳能和风能预测的四阶段混合框架,利用量子启发变分核进行残差修正,并利用生成式人工智能层实现可解释性。
对Polymarket和Kalshi等预测市场的分析,探讨其庞大的交易量是否真正产生了有价值的预测信息,还是仅仅沦为赌博,并参考了历史上的学术支持和当前数据。
随着 Polymarket 等平台因预测现实事件而获得主流关注,预测市场对新闻报道的影响日益深远,并逐渐成为新闻业独立报道的对象。
谷歌开源了时序预测基座模型TimesFM 2.5,参数量降至200M,上下文长度扩展至16k,可直接基于历史数值序列进行zero-shot预测。
Google DeepMind 发布 WeatherNext 2,这是一款先进的 AI 模型,使用单个 TPU 即可在不到一分钟内生成更快、更高分辨率的全球天气预报以及数百种情景。
本文介绍了一篇关于时间序列基础模型(TimeFM)的研究论文,这是一种仅解码器模型,通过借鉴大型语言模型技术,在多样化的时间序列数据集上实现了近乎最佳的零样本性能。