@lsteno: 看到模型最初只靠 Python 和梦想就能解决简单问题,然后你可以看到它如何…
摘要
观察者注意到模型如何从使用 Python 解决简单任务,逐渐发展到使用子调用来解决更困难的任务。
这真的很酷,看到模型最初只靠 Python 和梦想就能解决简单问题,然后你可以看到随着时间的推移,它学会使用子调用来解决更困难的任务 https://t.co/ll8gjOBPFq
查看缓存全文
缓存时间: 2026/05/24 22:26
看到模型先学会仅用Python和梦想解决简单任务,然后随着时间推移学会使用子调用来解决更难的任务,这真的很酷。https://t.co/ll8gjOBPFq
相似文章
@no_stp_on_snek: 过去几天的模型测试日志,一直在训练更多模型,致力于让我的TUI能够拥有……
一篇详细的日志,分享了训练三个系列共四个模型的经验教训,涵盖了LLM微调中的不变性以及架构特定的挑战,如推理模型评估陷阱、量化效应和行为微调的水床效应。
@no_stp_on_snek:微调小型开放模型时真正让我惊讶的事情。注意,我在这方面还算新手,所以有些内容可能看起来很显而易见……
一位开发者分享了微调小型开放模型时令人惊讶的经验教训,包括基础模型往往已经在预期改进点上达到极限,真正的弱点在于行为(屈服),而微调需要仔细的衡量和平衡。
@Vtrivedy10: 来自悉尼的又一精彩之作!我认为整个循环层次结构还非常早期,但一些我们知道有效的原语…
这条推文讨论了AI代理中循环层次结构的早期阶段,强调验证是可靠半长周期工作的关键原语。
本地模型从几乎无用迅速变得真正有用。是什么发生了变化?
文章指出,过去一年中,本地AI模型变得显著更有用,从玩具变成了编程和工作流程的实用工具,尽管在复杂任务上仍落后于闭源模型。
@bradenjhancock: 换句话说:人类正在教教师模型如何像优秀的人类教师教其他人那样教其他模…
人类正在训练教师模型,使其以循序渐进的方式教学生模型,并对跳跃式教学进行惩罚,从而提高模型的智能。