标签
Interhuman.ai 为其 Inter-1 模型推出了流式 API,通过 WebSocket 从实时视频流中检测 12 种社交信号,并支持参与度追踪和对话质量评分。
Artifact-Bench是一个综合性基准,用于评估多模态大语言模型在检测和分析AI生成视频伪影方面的表现,揭示了它们的显著局限性以及与人类感知的错位。
介绍knowly AI工具,可解读YouTube视频和arXiv论文,效果惊艳,交互与解读效果不逊于NotebookLM,有Chrome插件并通过谷歌精选。免费额度较少,向量处理稍慢。
Perceptron公司发布了其旗舰视频分析模型Mk1,声称成本比竞争对手低80-90%,同时在空间和视频推理基准上表现出色。
本文针对 Ego-Exo4D 数据集提出了三种参数高效的多视角熟练度评估方法,实现了从判别式分类到生成式反馈的转变。与基于视频 Transformer 的基线模型相比,所提出的模型在参数量和训练轮次大幅减少的同时,取得了最先进的准确率。