文件名称:高斯拉姆达
文件大小:106KB
文件格式:ZIP
更新时间:2024-02-29 02:02:34
C++
高斯拉姆达 elmo式学习のlambda设定の高斯化による学习の最适化 elmo式学习のlambda设定の高斯化とは何か? elmo式学习のlambdaは0で教师の胜败结果のみから学习し(Q-learning),1で浅い探索の评価値を胜率変换したものから教师の深い探索の评価値を胜率変换したものを引いたものだけを学习します。(Rootstrap) 诘み寸前の局面では胜败结果だけあれば十分で,仅か十数手先の探索结果など有意义した场合,长手数の顿死の危険性もあるかもしれません。逆に平手开始局面では,探索不可能な百几十手先の未来の胜败结果はあまり影响を大きくすべきでは无いのではと疑问に思います。指し手が固定化されて戦型が偏ってしまう悬念も(実际に巷の评価关数は既に居飞车の特定の戦形に偏ってしまっているようですが,胜败结果が原因なのかは分かりませんが,少なからず影响はあると思います。) Yane
【文件预览】:
Gaussian_lambda-master
----Gaussian_lambda(lambda0.5_σ600・800・1000).png(27KB)
----LICENSE(34KB)
----Gaussian_lambda(σ1000_lambda0.6・0.5・0.4).png(28KB)
----README.md(7KB)
----source()
--------learner.cpp(120KB)
--------readme.txt(521B)