文件名称:wigo:消息灵通的游戏运营商
文件大小:43KB
文件格式:ZIP
更新时间:2024-07-31 23:37:40
JavaScript
消息灵通的游戏运营商 这是SARS'.A'.-基于线性回归的学习的一个实现。 它旨在在没有先验知识的情况下玩任何具有离散输入和离散输出的游戏。 它一边玩一边学习,所以一开始会输一段时间,然后在学习玩的时候开始赢。 有关一系列不同示例游戏的演示,请参见此处: : 。 演示注意事项 该演示为代理提供了一系列配置设置: 环境 推荐值 笔记 基地 “度2”与“组合”; 或“简单线性”用于非常简单的游戏 用于线性回归的基函数(见下文)。 “度2‘与’组合”得到n^2碱基,每个组合的“与”为两位; “简单线性”是n基的集合,字面意思是输入位。 学习率 1 linreg 梯度下降的归一化“学习率”。 实际学习率(梯度下降公式中的 alpha)计算为1/n ,其中n是基数。 转发模式 softmax SARSA 学习者需要有很小的概率做出非“最优”的动作,这样它才能探索和学习新的、可能更好的策
【文件预览】:
wigo-master
----package.json(729B)
----gulpfile.coffee(748B)
----agent.json(22KB)
----src()
--------qLearning.coffee(3KB)
--------browser.coffee(636B)
--------package.json(222B)
--------agent.coffee(1KB)
--------regressor.coffee(1KB)
--------game.coffee(2KB)
--------play.coffee(498B)
--------helper.coffee(1KB)
--------games()
----demo()
--------index.html(4KB)
--------js()
--------src()
----README.md(10KB)
----bower.json(356B)
----build()
--------browser.js(52KB)