标签
本文探讨了利用强化学习微调小型(4B)递归语言模型(RLM)从科学文档中选取证据,结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下,达到了与Claude Sonnet 4.6相当的性能。
本文讨论了反AI宣传的努力,并重点介绍了近期AI行业新闻,包括英伟达的开源举措、OpenAI与亚马逊的交易、Grok降低视频价格以及递归语言模型。