标签
作者报告称,与标准 Q5_K_L 版本相比,Gemma 4 12b QAT 模型由于控制令牌配置错误导致的 bug,在工具调用和编码任务上出现了倒退。尽管令牌速度很高,但模型输出不一致,使其不适合代理工作流。
一种利用贝叶斯概率上下文无关文法生成结构上类似物理方程的合成回归数据集的方法,该方法已在费曼语料库上得到验证,并证明对超参数调优有效。
提出了一种用于低数据高维输出问题的Gaussian process latent factor regression (GPLFR),并通过一个针对岩质系外行星的全球气候模型的空间分辨仿真器进行了演示。
本文评估了表格基础模型(尤其是TabPFN)用于近红外光谱数据标定的效果。与传统化学计量学方法相比,该模型在回归和分类任务上表现出强劲性能。
本文介绍了一种分布感知的强化学习框架,该框架利用基于批级比较的监督信号,提升了多模态大语言模型在长尾数值回归任务中的性能。
用户反馈 Gemini 此前能对上传的音乐文件给出有用的音频点评,但在同一会话中突然不再识别或分析这些文件。