neuroevolution:神经进化作为直接策略搜索深度强化学习方法,使用Keras和DEAP实现

时间:2024-05-24 23:49:06
【文件属性】:

文件名称:neuroevolution:神经进化作为直接策略搜索深度强化学习方法,使用Keras和DEAP实现

文件大小:11KB

文件格式:ZIP

更新时间:2024-05-24 23:49:06

Python

神经进化作为直接策略搜索深度强化学习方法 使用深度学习库和进化计算框架实现。 项目状态:该项目仍在进行中,尚未完成。 概述 在直接策略搜索中,直接搜索可能策略的空间。 代理既不尝试对环境的过渡动力学建模,也不尝试显式学习不同状态或动作的价值。 取而代之的是,迭代地尝试改进参数化的策略。 直接策略搜索可以分为基于梯度的方法(也称为策略梯度方法)和不依赖梯度的方法。 无梯度方法包括进化算法。 在此体系结构中,卷积神经网络充当代理在其环境中感知的图像的压缩器。 它在定义,并使用通过神经进化进行。 循环神经网络基于压缩机的输出充当控制器。 它在定义,并通过使用进行训练。 必须定义和配置与环境交互的客户端。 使用与赛车模拟的定制版本进行交互的客户端来说明该实现。 先前的工作 此实现大致基于以下内容中描述的体系结构: Koutnik,Jan,Jurgen Schmidhuber和Fausti


【文件预览】:
neuroevolution-master
----neuroevolution()
--------evaluate_single_rnn.py(1KB)
--------cnn.py(2KB)
--------datasets.py(609B)
--------policy.py(2KB)
--------nn_utilities.py(1KB)
--------__init__.py(0B)
--------rnn.py(1KB)
--------train_cnn_ga.py(7KB)
--------evolve_rnn_controller.py(5KB)
----LICENSE(1KB)
----README.md(2KB)

网友评论