文件名称:graduation-project
文件大小:1.08MB
文件格式:ZIP
更新时间:2024-05-12 11:47:18
JupyterNotebook
老年项目 主题:基于深度强化学习的人工智能实体学习方法研究 通过在数学上对包括人类在内的动物的学习过程进行建模,深度强化学习(在AlphaGo中在韩国已广为人知)被评估为未来人工智能技术的核心。 它旨在通过在环境与代理之间的交互中重复试验和错误来学习最佳行为(策略)。 详细内容如下。 使用OpenAI开发的Gym中提供的环境。 它支持各种主题,从广泛使用的单一代理环境(例如MuJoCo和Classic Control)到有趣的主题(例如CarRacing)。 (但是,像Atari这样的接收状态信息的环境不会被视为毕业论文的主题。) 此外,还有诸如捉迷藏和神经网络MMO之类的环境,用于研究适用于多主体环境的强化学习算法。 如果在单代理环境中学习成功,我们希望将其扩展到多代理环境。 有多种(深度)强化学习算法可以应用于上述环境(例如:Q学习,DQN,DDQN,PPO,DDPG,TD
【文件预览】:
graduation-project-master
----LOG.md(489B)
----.vscode()
--------settings.json(44B)
----README.md(3KB)
----sample()
--------pytorch_prac()
--------cartpole_video()
--------mountaincar_modified()
--------save_as_mp4()
--------mountaincar_unmodified()
--------cartpole_cnn()
----.gitignore(34B)
----legacy()
--------Lab 6-1_ Q Network for Frozen Lake.ipynb(9KB)
--------Lab 7-1_ DQN 1 (NIPS 2013).ipynb(61KB)
--------Lab 4_ Q-learning (table) exploit & exploration and discounted reward.ipynb(9KB)
--------Lab 6-2_ Q Network for Cart Pole.ipynb(56KB)
--------Lab 5_ Q-learning in non-deterministic world.ipynb(20KB)
--------Lab 3_ Dummy Q-learning (table).ipynb(10KB)