@jennyzhangzt: 通用智能需要重新思考探索
摘要
本文认为,探索对于所有学习系统(包括监督学习)都是至关重要的,并提出了一种通用探索框架,以推动开放式学习走向通用智能。
查看缓存全文
缓存时间: 2026/05/17 01:25
通用智能需要重新思考探索
https://t.co/QA4uKB6oDl
通用智能需要重新思考探索
来源:https://arxiv.org/abs/2211.07819 查看PDF (https://arxiv.org/pdf/2211.07819)
摘要:我们正处于从“从数据中学习”向“学习应该从哪些数据中学习”转变的前沿,这一转变正成为人工智能研究的核心焦点。虽然一阶学习问题尚未完全解决,但基于统一架构的大模型(如Transformer)已将学习瓶颈从如何有效训练模型转移到了如何有效获取和使用任务相关数据。我们将此问题称为“探索”,它是真实世界等开放领域学习中普遍存在的方面。尽管AI中的探索研究主要局限于强化学习领域,但我们认为探索对所有学习系统都至关重要,包括监督学习。我们提出了广义探索问题,以在概念上统一监督学习和强化学习中基于探索的学习,从而突显不同学习环境之间的关键相似性以及开放的研究挑战。重要的是,广义探索是维持开放学习过程的必要目标,在不断学习发现和解决新问题的过程中,它为迈向更通用的智能提供了一条有前途的路径。
提交历史
来自:Minqi Jiang 查看邮箱 **[v1]**2022年11月15日 星期二 00:46:15 UTC (869 KB)
相似文章
学习探索:通过探索感知策略优化扩展代理推理
本文提出一种探索感知的强化学习框架,使LLM代理仅在不确定性高时自适应探索,从而提升在基于文本和基于GUI的基准测试上的性能。
三思而后行:LLM 智能体的自主探索
本文指出自主探索是大语言模型智能体的关键能力,并提出了先探索后行动范式,该范式将信息收集与任务执行解耦,以提升适应性和实际性能。同时引入了探索检查点覆盖率作为可验证的指标,用于评估探索的广度。
#探索:深度强化学习中基于计数的探索方法研究
OpenAI研究人员展示了一种使用哈希码的简单计数型探索方法,在高维深度强化学习基准测试中可以达到近似最优性能,这挑战了计数型方法无法扩展到连续状态空间的传统假设。
关于通过元强化学习学习探索的一些思考
OpenAI研究人员引入了E-MAML和E-RL²两种元强化学习算法,旨在改进需要大量探索来发现最优策略的任务中的探索性能。该工作展示了这些算法在包括Krazy World和迷宫任务在内的新颖环境中的有效性。
从生成视角探索空间智能
研究者推出首个量化多模态模型生成式空间智能的基准 GSI-Bench,通过在图像生成过程中评估 3D 空间约束遵守情况来衡量能力。在合成数据集上微调可显著提升空间编辑保真度与下游空间理解,证明生成式训练能增强空间推理。