vision-models

标签

Cards List
#vision-models

The Inattentional Gap: 任务条件化的语言与视觉模型会忽略本可报告的安全关键信号

arXiv cs.CL · 2天前 缓存

本文识别出'Inattentional Gap'现象,即任务条件化的AI模型会抑制报告其本可检测到的安全关键信号,类似于人类的非注意盲视,这挑战了基准性能即可确保现实世界安全的假设。

0 人收藏 0 人点赞
#vision-models

AllenAI 发布 MolmoMotion 视觉模型,基于短帧历史预测未来运动

Reddit r/LocalLLaMA · 2026-06-21

AllenAI 发布 MolmoMotion,一种旨在基于短帧历史预测未来运动的视觉模型。

0 人收藏 0 人点赞
#vision-models

GLARE:一种用于查询全局解释的自然语言接口

arXiv cs.AI · 2026-06-20 缓存

GLARE是一种基于LLM的接口,能够将自然语言问题转化为针对局部解释数据的SQL查询,使用户能够交互式地探索黑盒图像分类器的全局解释。

0 人收藏 0 人点赞
#vision-models

面向视觉与语言模型的经验贝叶斯共形预测

arXiv cs.LG · 2026-05-25 缓存

本文介绍了一种经验贝叶斯共形预测框架,该框架使用 r 值将评分变异性纳入非一致性得分中,从而提升排序稳定性并缩减集合大小,同时保持对视觉与语言模型的覆盖。

0 人收藏 0 人点赞
#vision-models

@defileo: 大多数人为一个MBA学位支付5万美元,只为了学到Chamath在一节课上免费教给斯坦福学生的内容。无需学…

X AI KOLs Timeline · 2026-05-20 缓存

Chamath Palihapitiya在斯坦福大学免费讲授了一堂关于扩散模型与视觉模型架构的课程,分享了如何在AI时代取得成功的见解。

0 人收藏 0 人点赞
#vision-models

@defileo: 谷歌愿意支付AI工程师40万美元年薪的两件事。斯坦福在一节免费的课上就讲完了。无需学费,无需申请…

X AI KOLs Timeline · 2026-05-19 缓存

一场免费的斯坦福讲座,内容涵盖扩散模型和视觉模型架构,被誉为掌握了能使 AI 工程技能达到谷歌顶级薪酬水平的基础知识。

0 人收藏 0 人点赞
#vision-models

@rohanpaul_ai: 中国正在大规模推广农业机器人。全天候自主收割成为粮食安全的新基准。视觉模型…

X AI KOLs Following · 2026-05-16 缓存

中国正在大规模推广农业机器人,实现全天候自主收割,利用视觉模型和机械臂提高效率,减少损伤,增强粮食安全。

0 人收藏 0 人点赞
#vision-models

@lmstudio: 视觉模型的批处理功能在我们的最新MLX引擎更新中现已进入Beta测试阶段。此更新还带来了主要……

X AI KOLs Following · 2026-05-14 缓存

LM Studio 宣布其 MLX 引擎的 Beta 更新,引入了视觉模型的批处理功能和改进的缓存,以加速推理。

0 人收藏 0 人点赞
#vision-models

@JonhernandezIA:前 Google 首席科学家 Fei-Fei Li 表示,业界对语言模型的过度聚焦十分危险。大部分真实……

X AI KOLs Following · 2026-05-11 缓存

前 Google 首席科学家 Fei-Fei Li 批评了 AI 行业对语言模型的过度关注,她指出,只有当系统通过视觉充分理解物理与空间世界时,真正的 AI 基础设施才会出现。

0 人收藏 0 人点赞
#vision-models

OpenAI Microscope

OpenAI Blog · 2020-04-14 缓存

OpenAI Microscope 是一个开源工具,能够系统地可视化常用视觉模型中的每个神经元,具备快速反馈循环和可链接的神经元,以支持可解释性研究。该平台将可视化时间从几分钟缩短到几秒,旨在使神经网络分析对研究社区更加易于访问。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈