AutoFlow 研究计划 —— 寻找深度技术思考者
摘要
AutoFlow 研究计划正在招募深度技术思考者,以构建能够独立验证 AI 生成的声明(从财务分析开始)的系统,并已加入 NVIDIA Inception 计划。
AutoFlow 研究计划 —— 寻找深度技术思考者
在过去的几个月里,我一直在探索一个位于 AI、验证、信任和决策系统交叉点的问题:我们能否构建能够独立验证 AI 产生的声明,而不仅仅是生成答案的系统?最初的设想始于财务分析。考虑这样一个声明:“公司营收同比增长 25%。”如今,大多数 AI 系统会生成这一声明,但并未对其进行正式验证。我们的方法不同:从文档、报告或 AI 输出中提取声明;收集支持性证据;在可能的情况下应用数学和逻辑验证;识别不一致和矛盾;产生透明的推理,而非黑箱结论。
第一个原型专注于财务领域,因为财务声明是结构化的、可衡量的,且通常可客观验证。例如包括:营收增长计算、财务比率验证、跨文档一致性检查、资产负债表核对以及利润表验证。
随着研究的深入,我们遇到了更深层次的问题,涉及可计算性、信任、治理、形式化验证和裁决。一个认识是,并非每个声明都能被数学证明。这引出了一个更大的挑战:已证明的事实、可验证的声明、有证据支持的结论以及人类式裁决之间的界限在哪里?这个问题正成为我们长期研究愿景的基础。
近期里程碑
- 被接纳加入 NVIDIA Inception
- 获得 NVIDIA 初创企业资源和技术项目的访问权限
- 构建首个以验证为中心的原型架构
- 与研究人员和经验丰富的工程师就验证和治理概念进行交流
- 初步接触种子前投资者和初创生态系统
我正在寻找的人
我有兴趣结识那些喜欢解决难题并愿意挑战假设的人。特别是:
- AI/ML 研究人员和工程师
- 形式化验证和定理证明爱好者
- 分布式系统和编排专家
- C++ 系统工程师
- 应用数学家
- 信任、治理和决策系统研究人员
你将得到什么
对于合适的长期合作者:
- 重要的技术所有权
- 对架构和研究方向的直接影响力
- 基于贡献和承诺的股权参与
- 访问团队可用的 NVIDIA Inception 资源
- 有机会帮助定义围绕 AI 信任和验证的新品类
我不是在寻找只是认同愿景的人。我在寻找能够发现其中缺陷的人。如果你对验证、可计算性、信任、形式化推理、治理、定理证明、符号系统或 AI 可靠性等概念感兴趣,我很乐意与你联系并交流想法。欢迎随时评论或发送消息。
相似文章
OpenAI创造了智能。谁来建立信任?
AutoFlow讨论了AI信任的关键挑战,提出了外部验证方法,如知识图谱和数学一致性检查,并宣布加入NVIDIA Inception计划,以推进可信AI系统的研究。
AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现
本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。
AutoResearch AI:迈向AI驱动的科学发现研究自动化
一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。
@VukRosic99: DeepSeek 研究员刚刚开源了他的个人项目 AutoResearch。该项目首次实现了自动化研究代理...
DeepSeek 研究员开源了 AutoResearch,这是一个自主框架,能够在无需人工干预的情况下,为 DeepSeek 285B 模型规划、执行并调试强化学习实验,并附带了一篇关于自我对弈的综述论文。
@lillian_ma_: 值得关注的自动化研究实验室:@AutoScienceAI(@eliot_cowan)——最纯粹的“AI构建AI”之一:智能体……
一则推特串强调了新兴的自动化研究实验室,它们正在构建AI系统来全自动化研究循环,从提出假设到进行实验。