最新

你的APM要爆表了！

Reddit r/AI_Agents ↗ · 2小时前

本文将《星际争霸II》职业比赛与管理AI智能体进行类比，认为AI智能体将知识工作者转变为同时协调多个独立系统的指挥官。

0 人收藏 0 人点赞

AI安全争论聚焦于错误的边界

Reddit r/AI_Agents ↗ · 2小时前

本文认为，AI安全辩论的方向有误，其关注点在于模型对齐和内部控制，而非关键的边界：对智能体执行的外部授权权限。文章警告称，能够自行授权高影响行动（如部署代码、转移资金）的系统构成了基本风险，日志记录和监控无法缓解这种风险。

0 人收藏 0 人点赞

AI代理缺失的一层不是自主性，而是结构化意图

Reddit r/AI_Agents ↗ · 2小时前

SR8是一种工具，它能将人类或机器的原始意图编译成AI系统的结构化制品规范，通过在执行前形式化上下文、约束和成功标准，弥合了模糊请求与高质量输出之间的鸿沟。

0 人收藏 0 人点赞

如何提高AI代理的可靠性？

Reddit r/AI_Agents ↗ · 1小时前

讨论将AI代理从沙箱迁移到生产环境所面临的挑战，强调高敏感性导致大量噪声，并提出解决方案，如二级评估器、启发式方法和级联架构。同时向社区询问他们的过滤方法。

0 人收藏 0 人点赞

我写了一篇关于AI Agents为何无法记忆的文章。

Reddit r/AI_Agents ↗ · 3小时前

作者描述了一次在大学进行的关于AI Agent记忆局限性的演讲，并以克里斯托弗·诺兰的电影《记忆碎片》作为类比，解释为何AI Agent在记忆方面存在困难。

0 人收藏 0 人点赞

自回归大语言模型正式与鱼共眠（Yann LeCun是对的）

Reddit r/AI_Agents ↗ · 3小时前

CETI项目使用大语言模型的架构解码抹香鲸的咔嗒声，揭示了其语音字母表，但也凸显出AI的统计模式匹配缺乏真正的理解。文章认为，AGI需要具身化、多模态的根基，而不仅仅是基于文本的模型扩展。

0 人收藏 0 人点赞

欧盟AI法案合规：如何将其融入产品开发

Reddit r/artificial ↗ · 2小时前缓存

文章讨论了企业如何从设计阶段就将欧盟AI法案合规要求融入产品开发，强调透明度、防护机制和人类监督是关键架构变化。

0 人收藏 0 人点赞

在工作场所假装高效——没人开心

Reddit r/artificial ↗ · 2小时前缓存

这篇文章批评了工作场所中AI生成内容的泛滥，员工使用Claude等工具来产出看似专业的内容，却缺乏真实的专业知识，导致管理和问责方面的系统性问题。

0 人收藏 0 人点赞

OpenAI诉讼期间马斯克访华，其律师因CEO缺席致歉

Reddit r/ArtificialInteligence ↗ · 2小时前缓存

马斯克律师在马斯克与阿尔特曼诉讼案的结案陈词中，向陪审团就马斯克的缺席致歉，因当时马斯克正在中国陪同特朗普总统。

0 人收藏 0 人点赞

Seed IQ ARC-AGI 3 声称

Reddit r/ArtificialInteligence ↗ · 4小时前

一名 Reddit 用户驳斥了 Seed IQ (AGX) 关于以满分解决 ARC-AGI-3 基准测试的声称，认为拒绝提交到允许闭源提交的 Kaggle 排行榜表明这是一个骗局。

0 人收藏 0 人点赞

我刚刚买了华硕 Ascent: Nvidia GB10 (DGX)，但它比我的 Ryzen Ai Max 慢。

Reddit r/LocalLLaMA ↗ · 2小时前

用户报告称，其搭载Nvidia GB10（DGX）的Asus Ascent在运行Gemma4-31B等大语言模型时，速度比Ryzen AI Max还要慢（预期应有2-4倍加速），并分享了他们的llama-cpp配置以供调试。

0 人收藏 0 人点赞

将E4B音频编码器添加到更大的模型

Reddit r/LocalLLaMA ↗ · 4小时前

作者提出一种方法，将E4B音频编码器添加到更大的模型中，通过提取编码器、创建线性投影层，并仅使用文本-音频对微调该层，类似于参考论文中的方法，但使用Gemma而非Whisper。

0 人收藏 0 人点赞

评估客服聊天代理系统的笔记：启发式评估器给出虚假信号，检索错误伪装成LLM失败，成本/质量的帕累托前沿往往不在你想的地方 [D]

Reddit r/MachineLearning ↗ · 3小时前

审计生产级客服RAG系统的实际发现：启发式评估器给出虚假信号，检索错误常伪装为LLM失败，成本与质量的帕累托前沿往往不在预期位置。模型扫查显示，用Gemma 4 26B替换原有模型（Gemini Flash Lite Preview）可在成本降低79%的同时实现19%的质量提升。

0 人收藏 0 人点赞

我构建了一个自托管开源MCP服务器，为本地LLM提供实时金融数据——SEC文件、13F、内幕交易和国会交易、空头数据、FRED

Reddit r/LocalLLaMA ↗ · 3小时前

介绍Equibles，一个自托管开源MCP服务器，为本地LLM提供实时美国金融数据，包括SEC文件、内幕交易和经济指标。

0 人收藏 0 人点赞

使用AI代理重构单体应用的经验教训

Lobsters Hottest ↗ · 7小时前缓存

1Password分享了使用AI代理分析和重构大型Go单体应用的经验，详细介绍了确定性工具的成功以及将代理应用于实时生产变更的挑战。

0 人收藏 0 人点赞

告别Tailwind，学习组织CSS

Lobsters Hottest ↗ · 4小时前缓存

作者反思了从Tailwind CSS迁移到带语义HTML的原生CSS的过程，分享了利用从Tailwind学到的重置、组件和工具类等系统来组织CSS的心得。

0 人收藏 0 人点赞

Ask HN：作为个体创业者如何获得SOC2 Type 2合规认证？

Hacker News Top ↗ · 13小时前缓存

一个Hacker News讨论帖探讨了个体创业者是否应该追求SOC2 Type 2合规认证，评论者建议不要进行投机性认证，并推荐了替代文档和安全实践。

0 人收藏 0 人点赞

Waymo召回约3,800辆Robotaxi，因车辆驶入积水路段

Hacker News Top ↗ · 2小时前缓存

Waymo自愿在美国召回约3,800辆Robotaxi，以修复导致车辆驶入积水路段的软件故障。此次召回源于在奥斯汀和圣安东尼奥发生的事故。

0 人收藏 0 人点赞

Show HN: 在你附近找到提供生奶、牧场鸡蛋等产品的本地农场

Hacker News Top ↗ · 3小时前缓存

farm-to-door是一个免费目录，用于查找美国农场，这些农场提供新鲜、农场直送的食物，如生牛奶、牧场鸡蛋和草饲肉类。

0 人收藏 0 人点赞

最新

你的APM要爆表了！

AI安全争论聚焦于错误的边界

AI代理缺失的一层不是自主性，而是结构化意图

如何提高AI代理的可靠性？

我写了一篇关于AI Agents为何无法记忆的文章。

自回归大语言模型正式与鱼共眠（Yann LeCun是对的）

欧盟AI法案合规：如何将其融入产品开发

在工作场所假装高效——没人开心

OpenAI诉讼期间马斯克访华，其律师因CEO缺席致歉

更多AI技术诉讼 - 集体诉讼

Seed IQ ARC-AGI 3 声称

我刚刚买了华硕 Ascent: Nvidia GB10 (DGX)，但它比我的 Ryzen Ai Max 慢。

将E4B音频编码器添加到更大的模型

评估客服聊天代理系统的笔记：启发式评估器给出虚假信号，检索错误伪装成LLM失败，成本/质量的帕累托前沿往往不在你想的地方 [D]

我构建了一个自托管开源MCP服务器，为本地LLM提供实时金融数据——SEC文件、13F、内幕交易和国会交易、空头数据、FRED

使用AI代理重构单体应用的经验教训

告别Tailwind，学习组织CSS

Ask HN：作为个体创业者如何获得SOC2 Type 2合规认证？

Waymo召回约3,800辆Robotaxi，因车辆驶入积水路段

Show HN: 在你附近找到提供生奶、牧场鸡蛋等产品的本地农场

提交意见反馈