文件名称:ANFIS:Tensorflow中的模糊Q学习,训练ANFIS
文件大小:38KB
文件格式:ZIP
更新时间:2024-05-28 08:37:58
Python
出租车队管理的DQN 提案:创建一个Deep Q学习网络,以帮助指示出租车分配给用户的请求。 使用规则来创建自适应神经模糊网络,规则的前提是用户的等待时间,出租车的活动时间,期望的乘车费用和出租车收取的总费用。 使用Q学习强化学习方法对网络进行训练。 训练有素的网络的输出是每个可以满足请求的出租车的Q因子。 找到基于决策树的预测 奖励功能: 任何强化学习算法都基于最大化一集动作结束时的总回报。 该模型的目的是确保每辆出租车的单位时间总车费率必须收敛到所有出租车的平均车费。 因此,该模型的回报函数是从比例积分微分控制器的软件实现输出中得出的。误差是当前收益率与平均收益率之差。 Q学习: Q学习是一种无模型的强化学习技术。 具体而言,可以使用Q学习为任何给定的马尔可夫决策过程(MDP)找到最佳的动作选择策略。 它通过学习动作值函数(Q函数)来工作,该函数最终给出了在给定状态下执行给定动作
【文件预览】:
ANFIS-master
----preprocessing.py(2KB)
----Rules.txt(2KB)
----.data-00000-of-00001(56B)
----fuzzyq1.csv(99KB)
----.meta(26KB)
----dataset.csv(26KB)
----run.py(555B)
----.index(238B)
----LICENSE.txt(1KB)
----fuzzyq.csv(99KB)
----README.md(3KB)
----.idea()
--------misc.xml(686B)
--------workspace.xml(26KB)
--------vcs.xml(180B)
--------ANFIS.iml(459B)
--------modules.xml(262B)
----__pycache__()
--------anfis.cpython-35.pyc(2KB)
----output.csv(37KB)
----dataset.py(334B)
----anfis.py(2KB)
----checkpoint(59B)