标签
提出SAGE,一种后处理方法,用于清洗大型语言模型中的最终遗忘向量,在不重新运行遗忘流程的情况下改善保留-遗忘权衡。
讨论DeepSeek近期融资事宜及其团队核心成员郭达雅和王丙轩离职情况,指出团队离职率极低,反映良好团队文化。