文件名称:SIT796-RL:SIT796强化学习
文件大小:1.32MB
文件格式:ZIP
更新时间:2024-04-14 08:52:46
JupyterNotebook
SIT796-RL SIT796强化学习 关于本机 “强化学习(RL)是由psychologyand神经科学的启发,并涉及能够采取行动的环境toachieve一个或多个目标软件代理的开发机器学习的三个基本范式之一。RL不同于监督学习中它不需要也不需要正确的输入/输出对andincorrect操作都直接纠正,而不是代理商平衡的勘探和开采搜索foroptimal政策。在这个单元学生将探索,研究和落实解决方案,以一系列的RL问题或MarkovDecision过程(MDP),包括其变体,如:离散时间MDP;半的MDP(SMDP);连续时间的MDP; PartiallyObservable-MDP(POMDP)和多目标的MDP(MOMDP)在解决这些问题,将适用的学生。 theirknowledge和技能提供一系列的技术,如:多武装土匪,奖励设计;数值迭代;政策倾斜;时间差分学习;在政策; 关政策
【文件预览】:
SIT796-RL-main
----Practical_1_Getting_Started.ipynb(263KB)
----RF_Anomaly_Detection_in_time_series.ipynb(17KB)
----README.md(1KB)
----Task_2_2C.ipynb(1.81MB)