@jennyzhangzt: 通用智能需要重新思考探索

X AI KOLs Timeline 论文

摘要

本文认为,探索对于所有学习系统(包括监督学习)都是至关重要的,并提出了一种通用探索框架,以推动开放式学习走向通用智能。

通用智能需要重新思考探索 https://t.co/QA4uKB6oDl
查看原文
查看缓存全文

缓存时间: 2026/05/17 01:25

通用智能需要重新思考探索

https://t.co/QA4uKB6oDl


通用智能需要重新思考探索

来源:https://arxiv.org/abs/2211.07819 查看PDF (https://arxiv.org/pdf/2211.07819)

摘要:我们正处于从“从数据中学习”向“学习应该从哪些数据中学习”转变的前沿,这一转变正成为人工智能研究的核心焦点。虽然一阶学习问题尚未完全解决,但基于统一架构的大模型(如Transformer)已将学习瓶颈从如何有效训练模型转移到了如何有效获取和使用任务相关数据。我们将此问题称为“探索”,它是真实世界等开放领域学习中普遍存在的方面。尽管AI中的探索研究主要局限于强化学习领域,但我们认为探索对所有学习系统都至关重要,包括监督学习。我们提出了广义探索问题,以在概念上统一监督学习和强化学习中基于探索的学习,从而突显不同学习环境之间的关键相似性以及开放的研究挑战。重要的是,广义探索是维持开放学习过程的必要目标,在不断学习发现和解决新问题的过程中,它为迈向更通用的智能提供了一条有前途的路径。

提交历史

来自:Minqi Jiang 查看邮箱 **[v1]**2022年11月15日 星期二 00:46:15 UTC (869 KB)

相似文章

三思而后行:LLM 智能体的自主探索

Hugging Face Daily Papers

本文指出自主探索是大语言模型智能体的关键能力,并提出了先探索后行动范式,该范式将信息收集与任务执行解耦,以提升适应性和实际性能。同时引入了探索检查点覆盖率作为可验证的指标,用于评估探索的广度。

关于通过元强化学习学习探索的一些思考

OpenAI Blog

OpenAI研究人员引入了E-MAML和E-RL²两种元强化学习算法,旨在改进需要大量探索来发现最优策略的任务中的探索性能。该工作展示了这些算法在包括Krazy World和迷宫任务在内的新颖环境中的有效性。

从生成视角探索空间智能

Hugging Face Daily Papers

研究者推出首个量化多模态模型生成式空间智能的基准 GSI-Bench,通过在图像生成过程中评估 3D 空间约束遵守情况来衡量能力。在合成数据集上微调可显著提升空间编辑保真度与下游空间理解,证明生成式训练能增强空间推理。