【文件属性】:
文件名称:rob311:2020年冬季
文件大小:18.38MB
文件格式:ZIP
更新时间:2021-02-17 22:43:50
Python
rob311
多伦多大学ROB311(人工智能)的实验室和最终项目。
实验1:状态空间搜索
实验2:结构化问题解决和计划
实验3:决策树和对抗游戏
实验4:马尔可夫决策过程
设置
安装Anaconda(Python 3)
打开Anaconda提示
导航到该存储库的根目录,然后运行conda env create -f rob311.yml 。
最终项目
本课程的最终项目是使用OpenAI Gym图书馆探索强化学习。 目标是建立一个代理来解决“ 。 该经纪人能够获得平均超过4700的最佳奖励,在班级中排名第二。
有关实现的详细信息,请参见的注释。