openai-research

标签

Cards List
#openai-research

关于通过元强化学习学习探索的一些思考

OpenAI Blog · 2018-03-03 缓存

OpenAI研究人员引入了E-MAML和E-RL²两种元强化学习算法,旨在改进需要大量探索来发现最优策略的任务中的探索性能。该工作展示了这些算法在包括Krazy World和迷宫任务在内的新颖环境中的有效性。

0 人收藏 0 人点赞
#openai-research

学习层级结构

OpenAI Blog · 2017-10-26 缓存

OpenAI 研究提出分层强化学习方法,其中智能体将复杂任务分解为高级操作序列而非低级操作,通过将搜索复杂度从数千步降低到数十步,显著提高长视野任务的效率。

0 人收藏 0 人点赞
#openai-research

深度线性网络中的非线性计算

OpenAI Blog · 2017-09-29 缓存

# 深度线性网络中的非线性计算 来源:[https://openai.com/index/nonlinear-computation-in-deep-linear-networks/](https://openai.com/index/nonlinear-computation-in-deep-linear-networks/) `` ``` 1x = tf.placeholder(dtype=tf.float32, shape=[batch_size,784]) 2y = tf.placeholder(dtype=tf.float32, shape=[batch_size,10]) 34w1 = tf.Variable(np.random.normal(scale=np.sqrt(2./784),size=[784,512]).astype(np.float32)) 5b1 = tf.Variable(np.zeros(512,dtype=np.float32)) 6w2 = tf.Variable(np.random

0 人收藏 0 人点赞
← 返回首页

提交意见反馈