research

标签

Cards List
#research

Metis:桥接文本与代码记忆以实现自我进化智能体

arXiv cs.CL · 5天前 缓存

Metis 开展了一项对比文本记忆与代码记忆的受控研究,发现两者具有互补的权衡特性。它提出了一种分层双表示记忆系统,在 AppWorld 基准测试中,任务准确率最高提升 20.6%,执行成本最高降低 22.8%。

0 人收藏 0 人点赞
#research

@rohanpaul_ai: LLM 常常无法判断攻击是否导致它们说出了不安全的内容。询问一个 LLM 它自己之前的回答是否……

X AI KOLs Timeline · 5天前 缓存

本文研究了 LLM 是否能够可靠地自我报告其输出被对抗性预填充篡改的情况,发现模型通常无法区分被篡改的输出和故意的输出,其有限的识别能力源自正常的拒绝行为,而非真正的自我意识。

0 人收藏 0 人点赞
#research

@yoheinakajima: ActiveGraph: 一个月进展: 论文#1: 日志即代理 3个LongMemEval实验 论文#2: 机制、自我改进循环…

X AI KOLs Following · 5天前 缓存

ActiveGraph宣布了两篇关于代理记忆(LongMemEval)和自我改进机制的新论文,并提供了参考代理、包模板以及即将在西雅图和旧金山举行的聚会。

0 人收藏 0 人点赞
#research

重新发明拉链

MIT Technology Review · 5天前 缓存

麻省理工学院的研究人员受一项40年前的专利启发,重新发明了拉链,采用三面紧固件设计,使其能够从柔性快速转变为刚性,适用于帐篷和石膏固定等场景。

0 人收藏 0 人点赞
#research

支持研究、创新与教育

MIT Technology Review · 5天前 缓存

敦促MIT校友及朋友支持学院推进科学领导力、择优录取和可负担教育的使命,以促进美国健康、安全与繁荣。

0 人收藏 0 人点赞
#research

我弄清楚了‘超级权重’的成因

Reddit r/ArtificialInteligence · 5天前

本文解释了大语言模型中的超级权重源于SoftMax与注意力机制的相互作用,该作用创建了一个充当稳定参考点的‘Nothing Dump’标记;移除这些权重会严重损害模型性能。

0 人收藏 0 人点赞
#research

确定性就是你所需

Reddit r/artificial · 5天前

本文介绍了一种利用确定性在Transformer模型中的新方法,基于'Attention Is All You Need'的范式。

0 人收藏 0 人点赞
#research

@tli104: 新论文:"Self-Compacting Language Model Agents" 语言模型代理会构建冗长的推理和工具调用轨迹。随着轨…

X AI KOLs Timeline · 5天前 缓存

新论文提出自压缩语言模型代理,该类代理可自行决定何时清理其推理和工具调用轨迹,以避免积累错误和过时信息。

0 人收藏 0 人点赞
#research

@N8Programs: 激动地宣布一篇关于我注意到的有趣数学对称性的 arXiv 笔记……它将经典MLP与…连接起来

X AI KOLs Timeline · 5天前 缓存

宣布一篇关于数学对称性的 arXiv 笔记,该对称性将经典MLP与Gated MLP连接起来,超越了经验性能。

0 人收藏 0 人点赞
#research

@SpaceX:今日任务将演示一款新型运载器,该运载器旨在为科学研究和太空制造业提供经济实惠、常规化的微重力环境访问。

X AI KOLs Following · 5天前 缓存

SpaceX的任务将演示一款新型运载器,以实现经济实惠、常规化的微重力访问,用于科学研究和在轨制造,并计划在太平洋溅落。

0 人收藏 0 人点赞
#research

智能的热力学度量

Reddit r/singularity · 6天前 缓存

本文提出了一种智能的热力学度量,定义为'rare-valid lift',并论证了递归自模拟对于高热力学智能是必要且近乎充分的,从而使智能可以在通用尺度上衡量。

0 人收藏 0 人点赞
#research

提示注入即角色混淆

Simon Willison's Blog · 6天前 缓存

研究论文表明,大语言模型存在'角色混淆'问题,即它们优先考虑文本风格而非实际的角色标签,从而使得提示注入攻击成为可能。去风格化文本将攻击成功率从61%降低到10%,这表明大语言模型安全性面临一项根本性挑战。

0 人收藏 0 人点赞
#research

提示注入即角色混淆

Hacker News Top · 6天前 缓存

本文提出一种理论,认为对大型语言模型的提示注入攻击源于模型在角色感知上的根本缺陷——将角色视为语言的类型系统。该理论解释了现有攻击,预测了新型攻击,并提出了关于角色科学的研究议程。

0 人收藏 0 人点赞
#research

修订版:新编写代码中受AI生成和审查影响的估计比例

Reddit r/singularity · 6天前

本文修订了由AI生成或审查的新编写代码的估计比例,并分析了其对软件开发的影响。

0 人收藏 0 人点赞
#research

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069064122218717387

X AI KOLs Timeline · 6天前 缓存

本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。

0 人收藏 0 人点赞
#research

@yunxi0623: https://x.com/yunxi0623/status/2069054269332889793

X AI KOLs Timeline · 6天前 缓存

介绍5个Codex Skills用于科研提效,包括论文框架搭建、图片转PPT、科研图示编辑、学术写作辅助以及高水平论文结构学习,强调将重复流程固定为可复用技能。

0 人收藏 0 人点赞
#research

@geekbb: 把基金经理郑希十几年来的季报、手记、采访全部整理成结构化的语料库,做成可溯源的 AI 技能,让 AI 能基于真实语料而非模型幻觉做投研问答与基金分析。 https://github.com/lyra81604/zhengxi-views…

X AI KOLs Timeline · 6天前 缓存

将基金经理郑希的公开季报、手记、采访整理为结构化语料库,并做成跨AI平台的可溯源技能,用于真实语料驱动的投研问答与基金分析。

0 人收藏 0 人点赞
#research

@arxivblog: 计算复杂性理论家证明引力必须量子化 https://arxivblog.substack.com/p/computational-comple…

X AI KOLs Timeline · 2026-06-22 缓存

计算复杂性理论家认为,半经典引力中的非线性动力学将使得不可想象的强大计算成为可能,从而证明引力必须量子化。该论文利用薛定谔-牛顿方程表明,经典引力与量子物质耦合会导致计算矛盾。

0 人收藏 0 人点赞
#research

@Phoenixyin13: 恭喜 @alisawuffles 正式加入 OpenAI! UW NLP PhD最后一年,OpenAI SuperAlignment Fellowship得主,Alisa Liu 官宣下周入职 OpenAI。 她在最近的 blog 里把整…

X AI KOLs Timeline · 2026-06-22 缓存

Alisa Liu(alisawuffles),UW NLP博士最后一年并获OpenAI SuperAlignment Fellowship,宣布下周入职OpenAI。她在博客中详细分享了求职过程,包括46场面试和11家顶级AI实验室的面试经验。

0 人收藏 0 人点赞
#research

AI现在能进行世界建模,从Anthropic Fable对峙实验可见

Reddit r/artificial · 2026-06-21

Anthropic证明,AI系统现在能够进行世界建模,Fable对峙实验即是证据。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈