AI_Dresses_Itself:这是Sirtube Raval在YouTube上发布的“可以自己打扮的AI”的代码

时间:2024-04-07 12:57:53
【文件属性】:

文件名称:AI_Dresses_Itself:这是Sirtube Raval在YouTube上发布的“可以自己打扮的AI”的代码

文件大小:8KB

文件格式:ZIP

更新时间:2024-04-07 12:57:53

Python

概述 这是Siraj Raval在YouTube上录制的视频的代码。这是研究人员在视频中使用的“信任区域策略优化”算法的实现。但是,他们没有公开其完整代码。因此,这是应用于游戏环境的技术。有人可以将其用作重新创建代码的起点。同时-嗨,研究人员:)继续发布它,社区对此表示赞赏。 TRPO的PyTorch实施 除非您出于某些特定原因需要TRPO,否则请尝试此实现(又名TRPO的更新更好的变体)。 这是的PyTorch实现。 这是大多数代码从移植而来的代码。与,该实现方式使用精确的Hessian向量乘积而不是有限差分近似。 会费 捐款很受欢迎。如果您知道如何使此代码更好,请随时发送请求请求。 用法 python main.py --env-name "Reacher-v1" 推荐的超级参数 倒立摆-v1:5000 Reacher-v1,InvertedDoublePendulum-v1:15


【文件预览】:
AI_Dresses_Itself-master
----models.py(1KB)
----main.py(6KB)
----utils.py(1KB)
----trpo.py(3KB)
----conjugate_gradients.py(774B)
----LICENSE.md(1KB)
----README.md(2KB)
----replay_memory.py(603B)
----running_state.py(2KB)

网友评论