skepticism

#skepticism

令牌压缩幻象：为什么我对RTK持怀疑态度

Hacker News Top ↗ · 3天前缓存

本文批评了RTK，一种用于LLM代理的令牌压缩工具，认为其声称的60-90%成本节省具有误导性，引入了静默失败风险，缺乏严格的准确性基准，并且作为独立产品在结构上脆弱。

0 人收藏 0 人点赞

#skepticism

Do you guys think subquadratic actually has a 12 million context model

Reddit r/ArtificialInteligence ↗ · 3天前缓存

Sub Quadratic 声称拥有 1200 万 token 上下文的模型，但仅限合作伙伴访问；在“大海捞针”测试中表现出色，但缺乏一般推理能力的证据，引发质疑。

0 人收藏 0 人点赞

#skepticism

在大型非科技公司中，AI 采用的实际进展如何？它真的具有变革性，还是只是管理层在胡说八道？

Reddit r/AI_Agents ↗ · 5天前

一位 FTSE100 公司的员工对 AI 采用面临的挑战表示沮丧，指出尽管公司施压要求使用 AI，但基本的数据质量和用户采用方面仍困难重重，并质疑变革是否真的会发生。

0 人收藏 0 人点赞

#skepticism

并非所有人都将AI用于一切

Hacker News Top ↗ · 2026-06-14 缓存

一篇新文章汇总了多项调查和使用研究，显示与炒作相反，大多数人很少或根本不使用AI，Z世代的采用停滞不前，约70%的美国适龄工作人口未使用AI。

0 人收藏 0 人点赞

#skepticism

🍔麦当劳与谷歌合作在得来速车道测试新AI

Reddit r/ArtificialInteligence ↗ · 2026-06-10

麦当劳与谷歌合作，在得来速车道测试名为ArchIQ的新AI系统，数字助手“Archy”处理了超过一百万份订单，其中90%无需人工干预。不过，消费者仍对裁员和错误持怀疑态度。

0 人收藏 0 人点赞

#skepticism

AI发展正在放缓

Hacker News Top ↗ · 2026-06-08 缓存

文章认为，AI产业正在放缓，面临巨大的财务挑战，需要数万亿美元的收入才能维持自身，并批评了推动AI泡沫的炒作和欺骗。

0 人收藏 0 人点赞

#skepticism

AI能否判断你的剧本能否成为卖座电影？

The Verge ↗ · 2026-06-05 缓存

本文探讨了Quilty，一家声称通过分析剧本预测电影成功的AI初创公司，但早期测试显示其准确性不佳，并引发了行业质疑。

0 人收藏 0 人点赞

#skepticism

怀疑论者看待网络上疯传的人形机器人视频指南 --- 每隔几个月，就会有一段人形机器人的视频在网上引发轰动。机器人在跑步、跳舞、折叠衣物、搬运箱子，看起来惊人地流畅、自然。评论区里不乏感叹：这就是未来、我们都要失业了。但在你彻底信服之前，不妨先停下来想一想。 --- ## 视频可能存在哪些问题？ ### 1. 这可能是经过大量剪辑的精华片段你看到的30秒视频，背后可能是数小时的拍摄素材。公司的公关团队会精心挑选最顺利的那几次，把磕磕绊绊、跌倒失误的片段统统剪掉。这不是造假，但绝对是一种选择性呈现。 ### 2. 任务可能经过专门设计机器人在视频中完成的任务，往往是为了机器人的能力边界量身定做的。地面平整、光线充足、物体摆放整齐——现实世界可没有这么配合。 ### 3. 可能存在远程遥控或辅助一些机器人演示实际上是由人类操作员远程控制的，或者在某些关键步骤上有人工干预。公司不一定会主动说明这一点。 ### 4. 速度可能经过调整视频有时会加速播放，让动作看起来比实际更流畅、更迅速。仔细观察背景中的元素，往往能发现端倪。 ### 5. 这可能是一次性的演示，而非可靠的重复表现一个机器人在受控环境下完成一次任务，和它能在现实条件下稳定、可靠地重复完成同一任务，是两件完全不同的事。 --- ## 为什么公司要这样做？答案很简单：融资。一段爆款视频可以吸引投资者的目光，提升公司估值，招募顶尖人才，并在竞争激烈的市场中建立品牌认知。这是一门生意，而不只是技术展示。 --- ## 这是否意味着人形机器人没有前途？当然不是。人形机器人领域确实取得了真实的、令人印象深刻的进展。Boston Dynamics、Figure、1X、Agility Robotics 等公司正在推动这一技术走向实用化。AI 与机器人技术的融合也在加速。但现实情况是：我们距离"真正通用"的人形机器人仍有相当长的路要走。 --- ## 作为普通观众，你应该怎么做？ - 追问细节：这段视频是自主完成的，还是遥控操作的？任务是如何设置的？ - 寻找长时间、未剪辑的演示：真正的能力经得起完整记录。 - 关注独立测试：第三方评估往往比官方宣传更可靠。 - 保持好奇，但不要轻易惊叹：技术进步是真实的，但炒作往往走在现实前面。 --- 下次当你看到一段让你目瞪口呆的机器人视频时，先深呼吸一下，然后问问自己：我看到的，究竟是技术本身，还是技术的营销？这两者都值得关注——但你需要知道自己面对的是哪一个。

Ars Technica ↗ · 2026-06-04 缓存

专家警告称，病毒式传播的人形机器人演示往往会误导公众和投资者——那些在演示中展现出惊人能力的机器人，通常无法将这些技能泛化到真实世界的各种不同场景中。来自 Agility Robotics 和 Physical Intelligence 的研究人员着重指出，精心策划的演示与机器人实际能力之间存在巨大差距。

0 人收藏 0 人点赞

#skepticism

蓝色地带真的存在吗？回答这个问题比以往任何时候都难

Hacker News Top ↗ · 2026-06-01 缓存

本文探讨了人们对蓝色地带科学有效性日益增长的怀疑。蓝色地带是由丹·比特纳推广的长寿热点地区，而研究人员对其数据及概念商业化提出质疑。

0 人收藏 0 人点赞

#skepticism

@no_stp_on_snek: https://subq.mildlyconcerning.com

X AI KOLs Timeline ↗ · 2026-05-26 缓存

本文批判性地分析了subQ长上下文AI技术的声明和时间线，指出了原始公告中的不一致之处和撤回内容。

0 人收藏 0 人点赞

#skepticism

Claude不是你的架构师。别再让它假装了

Hacker News Top ↗ · 2026-05-24 缓存

这篇评论文章尖锐指出，类似Claude的AI智能体缺乏真正软件架构所需的上下文判断力和说“不”的能力，警告人们不要让它们在缺乏人类监督的情况下设计系统。

0 人收藏 0 人点赞

#skepticism

你们在销售智能代理时如何与持怀疑态度的客户沟通？

Reddit r/AI_Agents ↗ · 2026-05-18

关于如何在销售AI代理时应对持怀疑态度的企业客户的讨论，建议关注业务成果而非底层技术。

0 人收藏 0 人点赞

#skepticism

@hunvreus: 和比我聪明的人聊过之后，我确信我时间线上很多搞AI的人都在胡说八道。没人能"一夜之间跑20个智能体"然后...

X AI KOLs Following ↗ · 2026-04-23

一条推文，表达了对声称AI智能体可以自主构建生产级软件的质疑，认为这种说法被过分夸大且不切实际。

0 人收藏 0 人点赞

skepticism

令牌压缩幻象：为什么我对RTK持怀疑态度

Do you guys think subquadratic actually has a 12 million context model

最新研究显示，仅16%的美国人认为人工智能会对社会产生积极影响

在大型非科技公司中，AI 采用的实际进展如何？它真的具有变革性，还是只是管理层在胡说八道？

并非所有人都将AI用于一切

🍔麦当劳与谷歌合作在得来速车道测试新AI

AI发展正在放缓

AI能否判断你的剧本能否成为卖座电影？

蓝色地带真的存在吗？回答这个问题比以往任何时候都难

@no_stp_on_snek: https://subq.mildlyconcerning.com

Claude不是你的架构师。别再让它假装了

你们在销售智能代理时如何与持怀疑态度的客户沟通？

@hunvreus: 和比我聪明的人聊过之后，我确信我时间线上很多搞AI的人都在胡说八道。没人能"一夜之间跑20个智能体"然后...

提交意见反馈