文件名称:iLQG-MuJoCo:用于多个MuJoCo模型的迭代LQG
文件大小:19KB
文件格式:ZIP
更新时间:2024-05-25 13:51:58
reinforcement-learning hopper optimal-control lqr mujoco
iLQG-MuJoCo 用于两个MuJoCo模型的迭代LQG。 在。 倒立摆和料斗演示 这里显示了收敛之前的一些迭代。 尤其是Hopper会做一些疯狂的事情,但是它会到达目的地(难怪为什么进化会消灭这些家伙)。 下面的整个过程被视为一次MPC运行。 您可以在模型中将contact solref [0]设置为稍高的数字,以获得更平滑的动态效果,从而获得更好的派生行为。 此回购包含: 基于迭代LQR算法: 改进的正则化 回溯线搜索 导数的有限差分计算,并行 Levenberg-Marquardt启发式 梯度的Hessian近似 MPC模式 依存关系 的OpenGL 用法 修改Makefile通过指定MJKEY和MUJOCO_PATH ,请与可执行make ,并与运行./bin/base ./res/inverted_pendulum.xml 。 待办事项 当然要更快 扩展到步行机器人 使
【文件预览】:
iLQG-MuJoCo-master
----tst()
--------test_derivatives.cpp(3KB)
----inc()
--------ilqr.h(5KB)
--------mjderivative.h(174B)
--------util.h(106B)
--------inverted_pendulum()
--------update.h(134B)
--------differentiator.h(3KB)
----src()
--------update.cpp(324B)
--------mjderivative.cpp(8KB)
--------util.cpp(520B)
--------inverted_pendulum()
----res()
--------inverted_pendulum.xml(1KB)
--------hopper.xml(3KB)
--------humanoid.xml(10KB)
----README.md(1KB)
----Makefile(1KB)
----.gitignore(158B)
----cmd()
--------basic.cpp(6KB)
----.clang_complete(76B)