标签
本文识别出'Inattentional Gap'现象,即任务条件化的AI模型会抑制报告其本可检测到的安全关键信号,类似于人类的非注意盲视,这挑战了基准性能即可确保现实世界安全的假设。
AllenAI 发布 MolmoMotion,一种旨在基于短帧历史预测未来运动的视觉模型。
GLARE是一种基于LLM的接口,能够将自然语言问题转化为针对局部解释数据的SQL查询,使用户能够交互式地探索黑盒图像分类器的全局解释。
本文介绍了一种经验贝叶斯共形预测框架,该框架使用 r 值将评分变异性纳入非一致性得分中,从而提升排序稳定性并缩减集合大小,同时保持对视觉与语言模型的覆盖。
Chamath Palihapitiya在斯坦福大学免费讲授了一堂关于扩散模型与视觉模型架构的课程,分享了如何在AI时代取得成功的见解。
一场免费的斯坦福讲座,内容涵盖扩散模型和视觉模型架构,被誉为掌握了能使 AI 工程技能达到谷歌顶级薪酬水平的基础知识。
中国正在大规模推广农业机器人,实现全天候自主收割,利用视觉模型和机械臂提高效率,减少损伤,增强粮食安全。
LM Studio 宣布其 MLX 引擎的 Beta 更新,引入了视觉模型的批处理功能和改进的缓存,以加速推理。
前 Google 首席科学家 Fei-Fei Li 批评了 AI 行业对语言模型的过度关注,她指出,只有当系统通过视觉充分理解物理与空间世界时,真正的 AI 基础设施才会出现。
OpenAI Microscope 是一个开源工具,能够系统地可视化常用视觉模型中的每个神经元,具备快速反馈循环和可链接的神经元,以支持可解释性研究。该平台将可视化时间从几分钟缩短到几秒,旨在使神经网络分析对研究社区更加易于访问。