neural-combinatorial-rl-pytorch:具有增强学习功能的神经组合优化的PyTorch实施https

时间:2024-06-05 07:38:14
【文件属性】:

文件名称:neural-combinatorial-rl-pytorch:具有增强学习功能的神经组合优化的PyTorch实施https

文件大小:174KB

文件格式:ZIP

更新时间:2024-06-05 07:38:14

reinforcement-learning pytorch seq2seq neural-combinatorial-optimization Python

神经组合rl火炬 PyTorch实现。 我已经用本文中的贪婪解码实现了基本的RL预训练模型。 有监督学习基线模型的实现。 我没有使用评论者网络,而是通过使用指数移动平均评论者在TSP上获得了我的结果。 评论者网络现在在我的代码中只是被注释掉了。 通过与其他几个人的通信,可以确定指数移动平均线评论员显着帮助改善了结果。 我的实现在指针网络中使用了一种随机的解码策略,该策略是在训练期间通过PyTorch的torch.multinomial()实现的,并且在测试模型时对波束进行搜索(尚未完成,仅支持1波束aka贪婪)进行解码。 当前,支持分类任务和平面对称欧几里得TSP。 有关如何运行代码的示例,请参见main.sh 使用--load_path $LOAD_PATH和--is_train False标志可以加载保存的模型。 要加载保存的模型并查看指针网络的关注层,请使用--plot_


【文件预览】:
neural-combinatorial-rl-pytorch-master
----plot_attention.py(696B)
----sorting_task.py(6KB)
----main.sh(1KB)
----img()
--------sort15-0.png(15KB)
--------tsp_20_val_reward.png(21KB)
--------sort20-0.png(20KB)
--------tsp_50_train_reward.png(18KB)
--------sort20-1.png(19KB)
--------sort15-1.png(15KB)
--------tsp_20_train_reward.png(18KB)
--------tsp_50_val_reward.png(20KB)
--------sort10-0.png(12KB)
--------sort10-1.png(12KB)
----scripts()
--------tune_hyper.sh(1KB)
--------plot_reward.py(944B)
--------hyperparam_search.py(680B)
----tsp_task.py(8KB)
----LICENSE(1KB)
----beam_search.py(4KB)
----README.md(4KB)
----.gitignore(34B)
----trainer.py(13KB)
----neural_combinatorial_rl.py(20KB)

网友评论