RL:一组RL实验。 目前包括

时间:2021-05-08 15:32:24
【文件属性】:
文件名称:RL:一组RL实验。 目前包括
文件大小:48.89MB
文件格式:ZIP
更新时间:2021-05-08 15:32:24
reinforcement-learning policy-gradient ranking-algorithm Python RL DQN 著名DQN算法的简单复制。 运行乒乓示例: python python/Pong/Pong_main pong_example MDP排名: 在[使用Markov决策过程进行等级增强学习]中复制MDP等级算法。 魏旭兰兰郭程SIGIR'17,2017] 相关论文:[适应马尔可夫决策过程以实现搜索结果多样化。 夏旭兰兰郭增曾SIGIR'17,2017] 运行OHSUMED示例 python python python/MDPrank/MDPrank_main.py letor_ohsumed_example 运行TREC示例 python python/MDPrank/MDPrank_main.py letor_trec_example --training_set Letor/TREC/TD2003/Data/Fold1/trainingset.txt --val

网友评论