RL-Theory-book

时间:2024-04-07 11:15:10
【文件属性】:

文件名称:RL-Theory-book

文件大小:34.96MB

文件格式:ZIP

更新时间:2024-04-07 11:15:10

TeX

RL-理论书(俄语) 状态:涵盖的主要主题,需要修订/编辑 频道1:简介 频道2:元启发式 内特·万恩 CEM,OpenAI-ES,CMA-ES 频道3:经典理论 贝尔曼方程 RPI,即兴政策。定理 价值迭代,策略迭代 时间差异,Q学习,SARSA 资格跟踪,TD-lambda 频道4:基于价值 DQN 双DQN,决斗DQN,PER,嘈杂DQN,多步DQN c51,QR-DQN,IQN,彩虹DQN 频道5:政策梯度 REINFORCE,A2C,GAE TRPO,PPO 频道6:连续控制 DDPG,TD3 SAC 频道7:基于模型 强盗 MCTS,AlphaZero,MuZero LQR 频道8:下一阶段 模仿学习/反强化学习 内在动机 多任务和事后观察 分层RL 部分可观察性 多代理商RL


网友评论