vision-models

#vision-models

The Inattentional Gap: 任务条件化的语言与视觉模型会忽略本可报告的安全关键信号

arXiv cs.CL ↗ · 2天前缓存

本文识别出'Inattentional Gap'现象，即任务条件化的AI模型会抑制报告其本可检测到的安全关键信号，类似于人类的非注意盲视，这挑战了基准性能即可确保现实世界安全的假设。

0 人收藏 0 人点赞

#vision-models

AllenAI 发布 MolmoMotion 视觉模型，基于短帧历史预测未来运动

Reddit r/LocalLLaMA ↗ · 2026-06-21

AllenAI 发布 MolmoMotion，一种旨在基于短帧历史预测未来运动的视觉模型。

0 人收藏 0 人点赞

#vision-models

GLARE：一种用于查询全局解释的自然语言接口

arXiv cs.AI ↗ · 2026-06-20 缓存

GLARE是一种基于LLM的接口，能够将自然语言问题转化为针对局部解释数据的SQL查询，使用户能够交互式地探索黑盒图像分类器的全局解释。

0 人收藏 0 人点赞

#vision-models

面向视觉与语言模型的经验贝叶斯共形预测

arXiv cs.LG ↗ · 2026-05-25 缓存

本文介绍了一种经验贝叶斯共形预测框架，该框架使用 r 值将评分变异性纳入非一致性得分中，从而提升排序稳定性并缩减集合大小，同时保持对视觉与语言模型的覆盖。

0 人收藏 0 人点赞

#vision-models

@defileo: 大多数人为一个MBA学位支付5万美元，只为了学到Chamath在一节课上免费教给斯坦福学生的内容。无需学…

X AI KOLs Timeline ↗ · 2026-05-20 缓存

Chamath Palihapitiya在斯坦福大学免费讲授了一堂关于扩散模型与视觉模型架构的课程，分享了如何在AI时代取得成功的见解。

0 人收藏 0 人点赞

#vision-models

@defileo: 谷歌愿意支付AI工程师40万美元年薪的两件事。斯坦福在一节免费的课上就讲完了。无需学费，无需申请…

X AI KOLs Timeline ↗ · 2026-05-19 缓存

一场免费的斯坦福讲座，内容涵盖扩散模型和视觉模型架构，被誉为掌握了能使 AI 工程技能达到谷歌顶级薪酬水平的基础知识。

0 人收藏 0 人点赞

#vision-models

@rohanpaul_ai: 中国正在大规模推广农业机器人。全天候自主收割成为粮食安全的新基准。视觉模型…

X AI KOLs Following ↗ · 2026-05-16 缓存

中国正在大规模推广农业机器人，实现全天候自主收割，利用视觉模型和机械臂提高效率，减少损伤，增强粮食安全。

0 人收藏 0 人点赞

#vision-models

@lmstudio: 视觉模型的批处理功能在我们的最新MLX引擎更新中现已进入Beta测试阶段。此更新还带来了主要……

X AI KOLs Following ↗ · 2026-05-14 缓存

LM Studio 宣布其 MLX 引擎的 Beta 更新，引入了视觉模型的批处理功能和改进的缓存，以加速推理。

0 人收藏 0 人点赞

#vision-models

@JonhernandezIA：前 Google 首席科学家 Fei-Fei Li 表示，业界对语言模型的过度聚焦十分危险。大部分真实……

X AI KOLs Following ↗ · 2026-05-11 缓存

前 Google 首席科学家 Fei-Fei Li 批评了 AI 行业对语言模型的过度关注，她指出，只有当系统通过视觉充分理解物理与空间世界时，真正的 AI 基础设施才会出现。

0 人收藏 0 人点赞

#vision-models

OpenAI Microscope

OpenAI Blog ↗ · 2020-04-14 缓存

OpenAI Microscope 是一个开源工具，能够系统地可视化常用视觉模型中的每个神经元，具备快速反馈循环和可链接的神经元，以支持可解释性研究。该平台将可视化时间从几分钟缩短到几秒，旨在使神经网络分析对研究社区更加易于访问。

0 人收藏 0 人点赞

vision-models

提交意见反馈