文件名称:SAC:软演员评论家的实施
文件大小:1.1MB
文件格式:ZIP
更新时间:2024-04-01 23:59:02
Python
软演员评论家(SAC) Descllione dell'algoritmo 软演员评论家深度强化学习DQN(Deep Q Learning)的非政策派生,也可以从以下方面进行分类: La Q函数视图的神经网络输入(输入:(stato,azione),输出:valore) 非因果关系的公司 L'agente conosce lo stato in cui si trova(communque una descrizione parziale dello stato attuale) L'agente conosce le azioni cheèin grado di compiere SAC永久性地保护所有人的利益。 L '安特罗皮亚definisce LAcasualità德拉政策:彪èelevata,彪升'输出德拉政策diventa imprevedibile,反之亦然未安特罗
【文件预览】:
SAC-master
----graphs()
--------overlying_plot.png(530KB)
--------single_test()
--------divided_plot.png(189KB)
----agent.py(12KB)
----utils()
--------memorybuffer.py(2KB)
--------__init__.py(0B)
--------tracker.py(2KB)
--------deepnetwork.py(3KB)
----main.py(2KB)
----config.yml(668B)
----README.md(7KB)
----generate_graphs.py(2KB)
----graph.py(1KB)
----stored_results()
--------test12()
--------test1()
--------test7()
--------test13()
--------test3()
--------test10()
--------test11()
--------test14()
--------test2()
--------test15()
--------test9()
--------test4()
--------test5()
--------test6()
----.gitignore(28B)