全部文章,按抓取时间从新到旧排列。
Yann LeCun 离开 Meta 创办 AI 公司 AMI,专注于基于联合嵌入预测架构(JEPA)的世界模型,他认为 LLM 不是通往人类智能的道路,并批评当前范式缺乏预测和规划能力。
Eric Jang 从头重建了 AlphaGo 并详细解释了蒙特卡洛树搜索和深度学习在围棋中的应用,展示了当前低成本复现强力围棋AI的可行性。
本文讨论了工程团队在采用AI编码代理时面临的实际挑战,如任务安全性、上下文检索、输出审查和协调,并提出了一个用于评估的准备度模型。
本文探讨了如果AI导致大规模失业,可能引发广泛社会暴力的可能性,并引用了日益高涨的反AI情绪以及专家关于易于引发政治暴力的结构性条件的警告。
Vision Agents 是一个开源Python框架,用于构建处理实时视频和音频的多模态AI智能体。它利用MediaPipe使对话智能体能够根据面部表情和目光方向调整语音。
AI Rep Counter 是一款运行在设备端的 iOS 应用,通过 iPhone 摄像头利用 AI 计数重复次数并分析锻炼姿势,提供隐私模式、锻炼指标和小组件等功能。
上海人工智能实验室发布 Intern S2,一个35B的科学多模态模型,在科学基准上与其自身1T模型表现相当,引入了Task Scaling作为新的扩展维度。采用Apache 2.0许可证。
罗永浩在币安交易所发现名为“罗永浩”的虚拟币冒用其姓名和头像,要求币安CEO赵长鹏下架该币种,以防他人受骗。
ManusAI 推出了一款 Google Drive 连接器,将静态存储转变为主动自动化引擎,使用户能够在 Manus 内跨 Docs、Sheets 和 Slides 进行读取、编辑和创建。
OpenAI 的开发者体验主管报告称,自上线以来,Codex 应用的周活跃用户已超过400万,用户平均发送消息量增加了5倍。
一位开发者分享了一种经济高效的工作流程,使用Claude Code结合DeepSeek V4和Codex,将前端、后端和审查任务分给三个模型。
Violin是一个开源端到端视频翻译+视频问答工具,整合ASR、LLM翻译和TTS,支持风格调整和内容再创作,可针对视频内容问答。
Hugging Face 的内核项目正在扩展,并寻求贡献者参与自主内核开发,为模型提供真正的优化价值。