matlabaic代码-rlfit:简单的Matlab代码使强化学习模型适合选择数据

时间:2024-06-08 21:44:50
【文件属性】:

文件名称:matlabaic代码-rlfit:简单的Matlab代码使强化学习模型适合选择数据

文件大小:9KB

文件格式:ZIP

更新时间:2024-06-08 21:44:50

系统开源

matlab aic代码健身 简单的Matlab代码使强化学习模型适合选择数据。 这将很容易开始。 向内工作: example.m在标准的增量规则强化学习模型中运行了一个简单的学习用例。 它要求您指定一个函数,该函数根据一组参数,选择历史记录和结果历史记录来计算每个选择的动作值。 只要结果规模相同,结果就可以有多种。 该函数期望每列有一种结果类型。 Q函数的参数不包括softmax参数。 rlfit.m是基本的界面功能。 它接受一个函数句柄,用于计算操作值,选择和结果历史记录以及对模型参数的约束(同样,不包括softmax参数)。 rlfit缩放操作值,从随机重启中多次拟合模型,在所有拟合中获得最大对数似然,并从最佳模型返回对数似然,操作值和拟合参数。 如果需要,您可以使用它们来计算AIC和BIC。 multmin.m使用允许的参数空间中的随机起点多次处理模型拟合。 LL_softmax.m处理softmax选择函数的对数似然计算。 它包括一些渐近展开式,当动作值非常大或非常小时,当概率非常接近0或1时,可以避免NaN。 楷模 Q_model.m是具有单个参数(学习率)的标准增量规则R


【文件预览】:
rlfit-master
----.gitignore(3B)
----Q_two_outcome.m(1KB)
----Q_model.m(689B)
----testdata.mat(368B)
----LL_softmax.m(1KB)
----randomdata.mat(463B)
----rlfit.m(2KB)
----multmin.m(667B)
----mutinf.m(354B)
----runningI.m(554B)
----example.m(626B)
----README.md(2KB)
----example_random.m(1KB)
----choice_entropy.m(201B)
----calculate_Q_bonuses.m(262B)
----add_perseveration.m(421B)

网友评论