文件名称:Minecraft_AI
文件大小:2.66MB
文件格式:ZIP
更新时间:2024-05-19 15:44:02
C
我的世界强化学习 重播记忆 DeepMind使用100万个内存 每个“记忆”都是SARS的序列 深度卷积网络 输入 输入将是游戏屏幕截图中的像素灰度亮度值 屏幕截图将在每k个游戏滴答时捕获(以减少计算开销) 屏幕截图按比例缩小到一些可管理的大小(DeepMind使用84x84) 几个(DeepMind使用4个)帧被组合以产生84x84x4的网络输入 结构 深度卷积网络具有用于从输入中提取特征的几层 第1层具有适用于8x8滑动窗口的滤波器,步长为4,随后是整流器 第2层具有用于4x4滑动窗口的滤波器,步长为2,随后是整流器 第3层具有256个完全连接的整流器节点 输出层为每个可能的代理动作提供一个节点(将最大动作视为最大) 算法 replay_memory = initReplayMemory(MEMORY_SIZE) network = initCNN(params) Run N ep