综合热度、重要程度与时效排序的热门资讯。
文章分析了AI平台不可持续的经济学,揭示了巨额补贴,像OpenAI和Anthropic这样的公司通过远低于成本的收费损失了数十亿美元,导致了可负担性危机。
特斯拉Model 3和Model Y被评为2026年美国制造含量最高的第1和第2名汽车,这是特斯拉连续第六年领跑该榜单。
Sawyer Merritt 强调了 SpaceX 的“星”系列计划:用于微重力研究和制造的 Starfall、用于轨道追踪的 Stargaze,以及用于安全卫星网络的 Starshield。
解释提示缓存如何在大型语言模型(LLM)中工作,以Claude为案例,详细说明Transformer的KV缓存机制以及在代理工作流中缓存静态前缀的成本效益。
Xteink 的 X3 和 X4 电子阅读器在 Prime Day 以八折优惠出售,提供比 Kindle 和 Kobo 更便携的选择,配备磁吸支架,并可选择升级至 CrossPoint Reader 固件。
Mozilla和Cloudflare正与其他浏览器合作,推出一项新举措,旨在打击机器人滥用行为的同时保护用户隐私。该方案提出采用基于匿名担保的速率限制方法,而非像验证码或Web环境完整性这样侵入性的验证方式。
SGLang 为 DeepSeek-V4 提供了首日支持,LMSys 与 NVIDIA 工程团队的合作在生产环境中实现了高达 5 倍的吞吐量提升,相关改进已在 SemiAnalysis InferenceX 仪表盘上展示。
一位用户对本地AI视频模型在Mac mini上达到Seedance 2.0或2.5质量的前景感到兴奋,认为这将使任何人都能在家里免费创作完整的故事片,无需工作室的守门人。
Lift4D是一个测试时优化框架,能够从单目野外视频中重建动态物体的完整4D几何、外观和形变,在具有遮挡和非刚性运动的挑战性序列上优于先前方法。
至少有七家中国公司正在出货H100/H200级别的AI加速器,多数近期上市,部分由前NVIDIA/AMD架构师创立。华为昇腾950瞄准H200级别性能,中国本土市场份额随着NVIDIA份额下降而上升。
一位开发者反思AI智能体如何消除Slack初创公司的利基市场,同时ClaudeDevs透露Claude Code现在为他们产品团队编写了65%的代码,包括Claude Tag工具本身。
Engram推出了一种从用户上下文中学习的人工智能,通过在个人和企业数据上扩展计算能力,创建理解特定工作环境的模型。他们为代理提供API,并与Notion、Harvey和Microsoft建立了合作关系。
F3 是一种下一代开源数据文件格式,通过嵌入 WebAssembly 解码器实现互操作性和可扩展性,解决了 Parquet 等传统格式的局限性。目前它是基于一篇发表于 ACM 的论文的研究原型。
一项分析质疑:考虑到在8xH200等昂贵硬件上运行大型模型的经济性,OpenRouter对GLM-5.2等开放模型的API定价是否意味着比假设的更激进的量化。
一位前谷歌员工讲述了自己因创建一款流行的非官方Google Workspace CLI工具而被解雇的经历。该工具在Hacker News和GitHub上迅速走红,而就在此前不久,谷歌刚刚宣布推出自己的官方Workspace CLI。
一条推特帖子强调了AI Agent的局限性:有用的运行会随会话结束而消失,并提出了将AI工作流转化为可复用的、带记忆的工件,这些工件可以作为桌面应用部署且不消耗token。