@johnschulman2: 人们有时会问，既然通用模型越来越好，为什么还要微调。桥水基金的工作是一个很好的提醒…

X AI KOLs Timeline 2026/07/01 01:36 新闻

fine-tuning finance expert-judgments distillation prompt-vs-finetune

摘要

John Schulman 强调桥水基金的工作表明，使用专家标注数据进行微调，在金融文档分类上能显著优于仅用提示的方法。

人们有时会问，既然通用模型越来越好，为什么还要微调。桥水基金的工作很好地提醒我们，只要有合适的数据——在这里是专家判断——你就能远胜于仅用提示的方法。@ddkang 和桥水 AIA Labs 团队很棒——很高兴看到他们分享这个。

查看原文

查看缓存全文

缓存时间: 2026/07/01 01:56

人们有时会问，既然通用模型不断进步，为什么还要微调？Bridgewater 的工作很好地提醒我们，有了正确的数据——这里指专家判断——你可以大幅超越仅依赖提示的方法。@ddkang 和 Bridgewater AIA Labs 团队非常出色——很高兴看到他们分享这一点。

Tinker (@tinkerapi): 对于前沿大语言模型来说，辨别哪些金融文档值得分析师投入时间出奇地困难。借助专家标注的数据集和在线策略蒸馏，Bridgewater 微调了一个模型，使其能够可靠且低成本地完成这项任务。

相似文章

@miramurati：Bridgewater利用其独特的金融知识，与我们及@tinkerapi合作，微调了一个模型，帮助……

X AI KOLs Following

Bridgewater与Tinker API合作，微调了一个大语言模型，以在金融任务中复现专家判断，在信息准确性和召回率上以更低成本超越了前沿模型。

@oneill_c: 1/ 我们微调了很多客户模型，因此我们决定系统地尝试找出一些微调的最佳实践…

X AI KOLs Following

该帖子分享了关于微调最佳实践的系统性实验结果，一次改变一个SFT变量，涵盖密集模型和MoE模型（参数规模达235B），在四个真实客户数据集上使用自定义评估来消除混淆因素。

@no_stp_on_snek: 微调现场笔记你可以在不教模型新知识的情况下让它有更好的判断力。我没有添加知识或…

X AI KOLs Following

作者分享的现场笔记显示，微调可以通过引导注意力来提升模型的判断力，无需添加新知识或权重，实际上是改变其本能而非智商。

@no_stp_on_snek：微调小型开放模型时真正让我惊讶的事情。注意，我在这方面还算新手，所以有些内容可能看起来很显而易见……

X AI KOLs Timeline

一位开发者分享了微调小型开放模型时令人惊讶的经验教训，包括基础模型往往已经在预期改进点上达到极限，真正的弱点在于行为（屈服），而微调需要仔细的衡量和平衡。

@LangChain: 微调开源模型可以超越或匹配前沿模型。基础 @Alibaba_Qwen 开箱即有良好的提示能力：强…

X AI KOLs Following

使用LoRA微调像阿里巴巴Qwen这样的开源模型，可以在错误分类任务上匹配或超越前沿模型性能。

提交意见反馈