我的百度飞桨“强化学习”7天打卡营学习心得

时间:2024-04-02 19:00:51

课程宣言:“百度NeurIPS全球顶会冠军团队亲自授课,7日全直播手把手教学,5大实战,带你从零实践强化学习!”
班主任:肖芮,飞桨深度学习学院,飞桨运营;
讲师:李科浇,飞桨深度学习学院,百度高级研发工程师。
7天总结
继参加2020年百度人工智能第十期深度学习培训结束之后,我就一直盼望着能有新一期的学习机会,传闻百度从来不会让全国人民失望的,这不,飞桨深度学习学院很快就满足我们的需求,从2020年6月15日开始举办了《强化学习7日打卡营-世界冠军带你从零实践》课程,这次的入场券都不用费多大劲,就轻松拿到了,我愉快地加入了“强化学习7日打卡营”学习微信群,见到了各位传说中的隐形大佬,还有我们可爱迷人的肖班主和科科老师。打卡营采用全程的直播+答疑+比赛的学习模式,7天时间里每日直播打卡学习、配合实战PK、全程社群答疑、百度飞桨认证结业证书等,虽然证书对我而言意义已经不大,但是还是很希望能拥有更多的百度证书,这也是一种信仰吧。在报名之后,我就开始了自己的炼丹之路!
打卡营学习的总体目标:
1. 带领初学者入门强化学习
2. 学会强化学习经典算法:Q-learning、Sarsa、DQN、Policy Gradient、DDPG
3. 学习本门课程后,可学会使用RL玩模拟游戏,玩四轴飞行器(控制悬停)

  • 第一天(学习目标:对强化学习(RL)产生初印象,包括了解RL基本概念,特征,熟悉环境搭建过程,要求能在本地“搭建GYM环境+PARL环境,把QuickStart 跑起来”)<说明:文中所有思维导图都源自科科老师教学视频>
    我的百度飞桨“强化学习”7天打卡营学习心得
  • 第二天(学习目标:了解基于表格型方法求解RL的方法,需要掌握一些概念,包括MDP、状态价值、Q表格,熟悉Sarsa、Q-learning代码,能用RL解决悬崖问题及其对比,要求使用Q-learning和Sarsa解决16宫格迷宫问题。)
    我的百度飞桨“强化学习”7天打卡营学习心得
  • 第三天(学习目标:了解基于神经网络方法求解RL的方法,熟悉函数逼近方法,能读懂DQN代码,解决CartPole问题,要求能使用DQN解决 MountianCar问题)
    我的百度飞桨“强化学习”7天打卡营学习心得
  • 第四天(学习目标:了解基于策略梯度求解RL的方法,熟悉基本概念,包括策略近似、策略梯度,理解Policy Gradient算法及其代码,解决CartPole问题,要求能使用Policy Gradient解决Atari的Pong问题)
    我的百度飞桨“强化学习”7天打卡营学习心得
  • 第五天(学习目标:了解连续动作空间上求解RL的方法,熟悉基本概念,包括连续动作空间、DDPG算法,理解PARL DDPG代码,要求使用DDPG解决四轴飞行器悬浮任务)
    我的百度飞桨“强化学习”7天打卡营学习心得
  • 总结
    强化学习、监督学习和非监督学习是机器学习的重要研究内容,本人一直以来对监督学习和非监督学习了解多一点,但是对于强化学习不甚了解。这次怀着忐忑不安的心情,来学习百度飞桨强化学习7日打卡营课程,因为我担心自己听不懂,你想它都能打败世界围棋冠军,这得有多复杂才行哈。七天学习之后,我开始想更深入去了解和学习强化学习了。这都是百度飞桨深度学习学院各位老师的功劳,特别是科科老师,没想到,真是没想到,这么年轻的科科老师,居然能把在线课程讲得那么清晰易懂,实在是太厉害了。希望以后还能再听到她的更高阶层的讲课内容。
    再次表示感谢,感谢科科老师的指导和教学,感谢班班的辛苦付出,感谢百度提供的学习机会。