标签
本文介绍了如何在Obsidian中使用Claude作为AI引擎构建知识图谱以发现关联,并指出当笔记相互链接而非孤立时,笔记系统会随着时间推移变得更有价值。
A Twitter thread shares the seven stages of AI-driven development from the Skills For Real Engineers project by @mattpocockuk, including alignment techniques like grill sessions and tooling for coding agents.
一篇投稿因未校准的 AI 检测器(Pangram)而被 NeurIPS 桌面拒稿,引发了对审稿流程循环性以及在目标分布上未经验证的误报率的担忧。
本文提出了一种针对LLM安全检测器的评估方法,旨在解决诸如按数据集调阈值、未公开操作点等系统性缺陷。该框架在16个基准上进行交叉验证,选取单一全局操作点,并包含多项泛化能力诊断指标。
文章提出软件工程方法论应从状态视角转向动力系统视角,强调吸引子逻辑优先于治理工具,在AI时代需显式建模状态空间、吸引子、轨迹与控制,以应对AI作为高频扰动源导致的架构漂移。
普林斯顿大学的一项研究发现,在17个领域的近300篇AI论文中存在数据泄露问题,导致结果过于乐观。作者强调了意外泄露数据的容易程度,并提醒不要轻信那些令人印象深刻的AI声明而不检查是否存在泄露。
一种在单个消费级GPU上自主训练Transformer语言模型的方法,分为六个阶段,设有验证门和AGENTS.md规范,适用于OpenClaw等编排框架。
源自大脑的神经元蛋白引流至硬脑膜、颅骨和鼻腔,而注入的脑脊液示踪剂则聚集在颈部淋巴结。该研究强调,注射本身可能会干扰正在研究的系统。
Science Superpowers是一种开源的、面向AI研究代理的计算科学方法论,强制预注册和可重复工作流,以防止p-hacking和HARKing。
一项个人研究项目将五个前沿LLM置于共享的生存岛屿环境中,不分配身份,使用独立的沟通、思维和情感通道。结果显示各通道之间存在分歧,且各模型表现出一致的行为特征,引发了关于AI智能体性格与欺骗的疑问。
作者介绍了LQS v3.1,一种使用多预言机共识和签名证书评估AI训练数据的开放方法,并附有已发表的论文和公共指数。该方法旨在解决AI训练数据市场中独立质量评估的瓶颈问题。
介绍了一种名为“人格工程”的方法论,该方法利用AI代理基于人际环状模型对谈判者人格进行参数化、操控和评估,从而能在谈判理论中进行受控实验。
本文批判了评估AI辅助编码工具的常见错误方法,例如计算代码行数、计时人工任务以及依赖开发者自我报告,主张采用更严谨的研究方法。
METR于2026年3月使用其时间跨度任务套件对Claude Mythos Preview早期版本进行了评估,估计其50%-时间跨度至少为16小时,表明该模型处于当前基准测试可测量的上限水平,同时也指出在更长的时间范围内存在稳定性问题。
关于第一性原理思维与类比推理的反思,以埃隆·马斯克在SpaceX降低火箭成本的方法以及作者自身的创业失败为例。
OpenAI 发布了一份白皮书,详细说明了他们对AI模型进行外部红队测试的方法,包括选择多样化红队成员、确定模型访问权限、提供测试基础设施以及整合反馈以改进AI安全和政策覆盖范围的方法。