标签
WIRED 的分析揭示,Meta 秘密将一段名为"NameTag"的人脸识别代码嵌入其 AI 应用程序,该程序已安装于数百万部手机之上。这一系统能够识别通过 Ray-Ban 和 Oakley 智能眼镜摄像头拍摄到的人物身份——而与此同时,Meta 却公开声称仍在"研究探讨"此类功能。这套休眠中的系统可将人脸转化为生物特征面纹,并与设备本地数据库进行比对,令这项 Meta 宣称已于 2021 年放弃的技术重新复活。
Meta 正在 Facebook 上推出一款 AI 创作者助手,能够根据创作者的表现数据提供个性化建议,涵盖发帖时间、受众洞察及内容创意等方面。此外,该公司还将 AI 翻译支持扩展至更多语言,包括阿拉伯语、法语和越南语。
推文指出,评估AI实验室的水平不应只看SOTA模型,而应关注"灌水论文率",并评论Meta AI内部的风气问题及Alexandr Wang取代Yann的贡献。
WavFlow 是 Meta AI 提出的一种新方法,它直接从视频和文本输入在原始波形空间中生成同步、高保真的音频,绕过了潜在压缩。在 VGGSound 和 AudioCaps 基准测试中,其性能与基于潜在空间的方法相当。
Meta的新论文介绍了一个智能体系统,它能在24小时的计算预算内自主发现神经架构,在350M、1B和3B规模上超越Llama 3.2。
Meta AI 正在从聊天框演变为随身感知层,新增语音对话、相机实时 AI 功能,并逐步进入眼镜形态,使 AI 能够看见、听见并理解用户眼前的世界。
文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究,具体涉及达尔文-哥德尔机器(Darwin-Gödel Machine)和超智能体(Hyperagents),它们能够自主重写自身代码和基础设施以提升性能,且无需人工干预。
Yann LeCun 通过列举 Attention、PyTorch 和 AlphaFold 等关键突破起源于蒙特利尔、伦敦和巴黎等地,反驳了硅谷在人工智能创新方面占据主导地位的说法。
Meta 的 FAIR 团队发布了 Flowception 的代码,这是 CVPR 2026 的一篇论文,介绍了一种非自回归视频生成框架。该框架通过交错帧插入与连续去噪,减少了误差累积和计算成本。
MIT教授Gabriele Farina通过将博弈论与机器学习相结合,推动AI决策能力的发展,这建立在他早期参与开发外交AI Cicero的工作基础之上。
Meta AI 发布了 SAM 3.1,这是 Segment Anything Model(分割一切模型)的一次更新,通过引入多路复用和全局推理能力,增强了实时视频检测与跟踪性能。
Meta AI 和牛津大学 VGG 发布了 VGGT-Omega,这是一个用于 3D 视觉的基础模型,附有项目页面和 GitHub 仓库。