标签
Metis 开展了一项对比文本记忆与代码记忆的受控研究,发现两者具有互补的权衡特性。它提出了一种分层双表示记忆系统,在 AppWorld 基准测试中,任务准确率最高提升 20.6%,执行成本最高降低 22.8%。
本文研究了 LLM 是否能够可靠地自我报告其输出被对抗性预填充篡改的情况,发现模型通常无法区分被篡改的输出和故意的输出,其有限的识别能力源自正常的拒绝行为,而非真正的自我意识。
ActiveGraph宣布了两篇关于代理记忆(LongMemEval)和自我改进机制的新论文,并提供了参考代理、包模板以及即将在西雅图和旧金山举行的聚会。
麻省理工学院的研究人员受一项40年前的专利启发,重新发明了拉链,采用三面紧固件设计,使其能够从柔性快速转变为刚性,适用于帐篷和石膏固定等场景。
本文解释了大语言模型中的超级权重源于SoftMax与注意力机制的相互作用,该作用创建了一个充当稳定参考点的‘Nothing Dump’标记;移除这些权重会严重损害模型性能。
新论文提出自压缩语言模型代理,该类代理可自行决定何时清理其推理和工具调用轨迹,以避免积累错误和过时信息。
宣布一篇关于数学对称性的 arXiv 笔记,该对称性将经典MLP与Gated MLP连接起来,超越了经验性能。
SpaceX的任务将演示一款新型运载器,以实现经济实惠、常规化的微重力访问,用于科学研究和在轨制造,并计划在太平洋溅落。
本文提出了一种智能的热力学度量,定义为'rare-valid lift',并论证了递归自模拟对于高热力学智能是必要且近乎充分的,从而使智能可以在通用尺度上衡量。
研究论文表明,大语言模型存在'角色混淆'问题,即它们优先考虑文本风格而非实际的角色标签,从而使得提示注入攻击成为可能。去风格化文本将攻击成功率从61%降低到10%,这表明大语言模型安全性面临一项根本性挑战。
本文提出一种理论,认为对大型语言模型的提示注入攻击源于模型在角色感知上的根本缺陷——将角色视为语言的类型系统。该理论解释了现有攻击,预测了新型攻击,并提出了关于角色科学的研究议程。
本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。
介绍5个Codex Skills用于科研提效,包括论文框架搭建、图片转PPT、科研图示编辑、学术写作辅助以及高水平论文结构学习,强调将重复流程固定为可复用技能。
将基金经理郑希的公开季报、手记、采访整理为结构化语料库,并做成跨AI平台的可溯源技能,用于真实语料驱动的投研问答与基金分析。
计算复杂性理论家认为,半经典引力中的非线性动力学将使得不可想象的强大计算成为可能,从而证明引力必须量子化。该论文利用薛定谔-牛顿方程表明,经典引力与量子物质耦合会导致计算矛盾。
Alisa Liu(alisawuffles),UW NLP博士最后一年并获OpenAI SuperAlignment Fellowship,宣布下周入职OpenAI。她在博客中详细分享了求职过程,包括46场面试和11家顶级AI实验室的面试经验。