标签
本文批评了RTK,一种用于LLM代理的令牌压缩工具,认为其声称的60-90%成本节省具有误导性,引入了静默失败风险,缺乏严格的准确性基准,并且作为独立产品在结构上脆弱。
Sub Quadratic 声称拥有 1200 万 token 上下文的模型,但仅限合作伙伴访问;在“大海捞针”测试中表现出色,但缺乏一般推理能力的证据,引发质疑。
皮尤研究中心的一项研究显示,只有16%的美国人认为人工智能在未来20年内会对社会产生积极影响,其中年轻人最为怀疑,大多数人认为人工智能发展过快。尽管如此,自2023年以来,ChatGPT的使用量翻了一番,目前44%的美国成年人正在使用它。
一位 FTSE100 公司的员工对 AI 采用面临的挑战表示沮丧,指出尽管公司施压要求使用 AI,但基本的数据质量和用户采用方面仍困难重重,并质疑变革是否真的会发生。
一篇新文章汇总了多项调查和使用研究,显示与炒作相反,大多数人很少或根本不使用AI,Z世代的采用停滞不前,约70%的美国适龄工作人口未使用AI。
麦当劳与谷歌合作,在得来速车道测试名为ArchIQ的新AI系统,数字助手“Archy”处理了超过一百万份订单,其中90%无需人工干预。不过,消费者仍对裁员和错误持怀疑态度。
本文探讨了Quilty,一家声称通过分析剧本预测电影成功的AI初创公司,但早期测试显示其准确性不佳,并引发了行业质疑。
专家警告称,病毒式传播的人形机器人演示往往会误导公众和投资者——那些在演示中展现出惊人能力的机器人,通常无法将这些技能泛化到真实世界的各种不同场景中。来自 Agility Robotics 和 Physical Intelligence 的研究人员着重指出,精心策划的演示与机器人实际能力之间存在巨大差距。
本文探讨了人们对蓝色地带科学有效性日益增长的怀疑。蓝色地带是由丹·比特纳推广的长寿热点地区,而研究人员对其数据及概念商业化提出质疑。
本文批判性地分析了subQ长上下文AI技术的声明和时间线,指出了原始公告中的不一致之处和撤回内容。
这篇评论文章尖锐指出,类似Claude的AI智能体缺乏真正软件架构所需的上下文判断力和说“不”的能力,警告人们不要让它们在缺乏人类监督的情况下设计系统。
一条推文,表达了对声称AI智能体可以自主构建生产级软件的质疑,认为这种说法被过分夸大且不切实际。