文件名称:bandit-sponsored-search
文件大小:10.97MB
文件格式:ZIP
更新时间:2024-05-29 03:15:20
Python
在不知道自己的价值的情况下学习竞标 从我们的论文中复制实验结果的代码: : 。 先决条件 Python 2.7.13 conda4.4.10 RStudio(如果要运行绘图仪) 执行 用于不同模拟的文件夹,其中包含遗忘的对手(随机对手),使用EXP3的自适应对手和使用WINEXP的自适应对手。 为了运行每个模拟: python runner-dp.py 这将创建2个.txt文件:winexp_regrets.txt和exp3_regrets.txt。 这些文件包含每个重复和每个时间步的后悔,它们的大小为num_repetitions xT。此外,它将创建一个.png文件,并带有后悔图。 对于为不同离散创建图表的文件夹,每种算法(winexp和exp3)和每种离散(0.001、0.01、0.1)都有一个单独的.txt文件。 我们还包括.R文件,这些文件提取图形以及出现在我们论文