RL:一组RL实验。 目前包括

时间:2024-05-28 09:19:04
【文件属性】:

文件名称:RL:一组RL实验。 目前包括

文件大小:48.89MB

文件格式:ZIP

更新时间:2024-05-28 09:19:04

reinforcement-learning policy-gradient ranking-algorithm Python

RL DQN 著名DQN算法的简单复制。 运行乒乓示例: python python/Pong/Pong_main pong_example MDP排名: 在[使用Markov决策过程进行等级增强学习]中复制MDP等级算法。 魏旭兰兰郭程SIGIR'17,2017] 相关论文:[适应马尔可夫决策过程以实现搜索结果多样化。 夏旭兰兰郭增曾SIGIR'17,2017] 运行OHSUMED示例 python python python/MDPrank/MDPrank_main.py letor_ohsumed_example 运行TREC示例 python python/MDPrank/MDPrank_main.py letor_trec_example --training_set Letor/TREC/TD2003/Data/Fold1/trainingset.txt --val


网友评论