feedback

标签

Cards List
#feedback

通过反思增强自蒸馏在稀有成功但反馈丰富的场景中学习

arXiv cs.LG · 5小时前 缓存

本文介绍了反思增强自蒸馏(RESD)框架,该框架将失败反馈转化为对LLM的纠正性监督,从而实现从稀有成功中高效学习。该框架优于标准自蒸馏基线,并且相比GRPO,使用更少的样本实现了更快的早期改进。

0 人收藏 0 人点赞
#feedback

@petergyang: 有时候我给 Claude Code 发消息时,它会卡住 3 分钟,我根本不知道它是否还在运行。……

X AI KOLs Following · 4天前 缓存

有用户反映,Claude Code 有时会卡住三分钟,且不提供任何状态更新或反馈,让人无法判断它是否仍在处理。

0 人收藏 0 人点赞
#feedback

BugDrop

Product Hunt · 6天前

BugDrop 是一款应用内反馈工具,能自动创建带截图的 GitHub Issues,帮助开发团队简化 Bug 报告流程。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈