rob311:2020年冬季

时间:2024-03-09 16:30:30
【文件属性】:

文件名称:rob311:2020年冬季

文件大小:18.38MB

文件格式:ZIP

更新时间:2024-03-09 16:30:30

Python

rob311 多伦多大学ROB311(人工智能)的实验室和最终项目。 实验1:状态空间搜索 实验2:结构化问题解决和计划 实验3:决策树和对抗游戏 实验4:马尔可夫决策过程 设置 安装Anaconda(Python 3) 打开Anaconda提示 导航到该存储库的根目录,然后运行conda env create -f rob311.yml 。 最终项目 本课程的最终项目是使用OpenAI Gym图书馆探索强化学习。 目标是建立一个代理来解决“ 。 该经纪人能够获得平均超过4700的最佳奖励,在班级中排名第二。 有关实现的详细信息,请参见的注释。


网友评论