文件名称:论文研究-多车型回程车辆调度问题的ADP算法研究.pdf
文件大小:1.28MB
文件格式:PDF
更新时间:2022-08-11 12:59:33
近似动态规划, 车辆调度, Q学习, 探索策略
采用近似动态规划(ADP)方法对钢铁物流运输过程中的车辆调度问题进行了分析, 设计了车辆和运输货物的状态向量空间、动作向量空间等, 充分考虑运输成本和能力约束, 建立状态转移函数、目标函数, 并对近似动态规划算法进行改进。在基于决策后状态的ADP算法的基础上, 采用Boltzmann探索策略对所有的状态空间进行遍历, 避免局部最优和低效问题。通过对比实验, 比较Q学习算法、基于决策后状态的ADP算法以及采用Boltzmann探索策略的ADP算法的实验结果, 证明了采用Boltzmann探索策略的ADP算法具有更快的收敛速度, 执行效率更高。