标签
本文介绍了 CATS,这是一种级联自适应树猜测框架,旨在通过优化内存使用同时保持高 Token 接受率,加速内存受限边缘设备上的 LLM 推理。
本文提出了 ReAD,这是一种强化引导的能力蒸馏框架,通过考虑大型语言模型中的跨能力迁移来优化 token 预算。与现有基线相比,该方法在提升下游效用的同时,减少了有害溢出。
本文介绍了九个Claude代理,它们在夜间运行,处理简报、研究、收件箱分类等任务,让用户醒来即可看到已完成的工作。文章还提供了使用Claude Code、Claude.ai或Claude Desktop设置每个代理的说明。
本文在可解释人工智能(XAI)的框架下,建立了基于一致性的诊断(Consistency-Based Diagnosis)与实际因果关系(Actual Causality)之间的联系。其目标是将这两个领域融合,以提升人工智能及可解释数据管理中的解释能力。
本文介绍了 ReplaySCM,这是一个旨在评估语言模型从干预证据中归纳可执行因果机制能力的基准测试,重点关注语义重放行为而非语法匹配。
Modal 宣布与 OpenAI Devs 和 Antler Global 合作,将于 5 月 30 日举办 Autoresearch Systems Hackathon,旨在应对数据和计算密集型挑战。
超过600名OpenAI员工通过要约收购方式执行了一笔66亿美元的股票出售,平均每人1100万美元。此时,公司估值在尚未公开上市前已攀升至4000亿美元。
Anthropic 发布了 Claude Mythos,这是一款能力极强的 AI 模型,旨在自动发现操作系统、浏览器和软件库中的安全漏洞。出于双重用途风险的考虑,该模型最初仅通过 Project Glasswing 向部分企业和开源合作伙伴开放,此次发布引发了业界关于 AI 安全能力与企业营销策略的广泛争论。
ConsensusNLP 宣布获得 3000 万美元新融资,用于开发科研 AI 操作系统,每月服务 250 万研究人员。
本文探讨了顶尖 AI 专家之间的争论:仅靠 LLM 能否实现 AGI,抑或是否需要诸如世界模型之类的额外突破。
本文提供了一份另类的职场指南,旨在帮助专业人士在人工智能行业持续的裁员潮中保住工作。
本文探讨了亚美尼亚在后苏联时期经济变迁背景下,将人工智能和信息通信技术作为数字再工业化手段的战略转向。文章详细介绍了 Firebird、Dell 和 NVIDIA 参与的一项重大举措,计划向本地人工智能超级计算基础设施投资 5 亿美元。
一位好莱坞编剧详细讲述了在2023年罢工潮引发行业动荡的背景下,从电视编剧转向AI训练零工的经历。文章揭示了AI劳动力市场的残酷现实,包括红队测试任务以及零工平台的运作机制。
前 Google 首席科学家 Fei-Fei Li 批评了 AI 行业对语言模型的过度关注,她指出,只有当系统通过视觉充分理解物理与空间世界时,真正的 AI 基础设施才会出现。
硅谷顶级风投A16z创始人Marc Andreessen为年轻人提供未来20年职业发展建议,推荐优先加入高速增长的科技公司或主修计算机科学,并指出AI、加密货币与合成生物学是重塑未来的核心赛道。
本文介绍了 SpecBlock,这是一种块迭代式投机解码方法,通过将路径依赖与高效的草拟相结合来加速大语言模型的推理。与 EAGLE-3 等现有方法相比,它在保持更低草拟成本的同时展示了更高的加速比。
本文介绍了 WorldReasonBench 和 WorldRewardBench,这两个新基准旨在评估视频生成模型对世界状态演变和物理一致性的推理能力。研究突显了当前商业视频生成器在视觉合理性与真实逻辑推理之间存在的差距。
一则推文提及AI研究员Sebastien Bubeck,暗示某些讨论中的能力需要使用像假想中的GPT-5.5这样的先进模型。
一条社交媒体帖子分享了一个长达三小时的 AGI 大师课视频链接,内容涵盖人工智能、自动化及未来趋势。
本文探讨了人形机器人作为 AI 炒作周期的最新阶段,指出虽然它们在视觉上令人印象深刻,但创造出实用且具成本效益的劳动力仍然是一个巨大的挑战。