文件名称:城市交通信号智能控制方法研究
文件大小:2.13MB
文件格式:KDH
更新时间:2014-06-05 17:20:35
增强算法 Q-learning
用Q学习和BP算法解决交通信号控制问题的过程如下: 步骤1:在决策时间点,观察当前的交通状态s; 步骤2:通过Q值存储网络计算每种行为对应的Q值; 步骤3:管理Agent根据一定的策略选择行为a,并分别交由各个路口 Agent执行; 步骤4:执行行为a后,收到回报r; 步骤5:观察新的交通状态s',
文件名称:城市交通信号智能控制方法研究
文件大小:2.13MB
文件格式:KDH
更新时间:2014-06-05 17:20:35
增强算法 Q-learning
用Q学习和BP算法解决交通信号控制问题的过程如下: 步骤1:在决策时间点,观察当前的交通状态s; 步骤2:通过Q值存储网络计算每种行为对应的Q值; 步骤3:管理Agent根据一定的策略选择行为a,并分别交由各个路口 Agent执行; 步骤4:执行行为a后,收到回报r; 步骤5:观察新的交通状态s',