文件名称:billion-placeholder:使用 Kaggle HowTo 时的占位符
文件大小:383KB
文件格式:ZIP
更新时间:2024-06-28 11:04:44
Python
十亿占位符
使用 Kaggle HowTo 时的占位符
其目的是在 2015 年 1 月期间(即在比赛结束之前)将的有效解决方案引入公共领域。 我的想法是,许多潜在的竞争者因为任务太艰巨而退缩,但如果有一些已知的不错的起点,他们会被鼓励“试一试”。
然而,现实世界进行了干预,将神经网络(基于 Theano)的实现搁置 - 以至于时钟开始耗尽。
只是为了进行某种展示,我创建了一种全新的方法,基于只使用 Go 语言的二元组,在一个周末,为了好玩。
这个解决方案(当然)比使用最初针对的 NN 方法所能实现的要糟糕得多,但具有准备快速提交的优势。
因此,我有点为没有实现最初的目标而辞职,我只是提交了一个基于双元组方法的基本提交,以及另一对基于优化几个超参数的提交。 这对于 87 个中的第 12 个来说已经足够了。
就这样结束了……
唯一可提交的结果是由
【文件预览】:
billion-placeholder-master
----notes.txt(13KB)
----.gitignore(100B)
----src()
--------gap_model.py(15KB)
--------corpus-glove.sh(2KB)
--------make_corpus.py(1KB)
--------glove_to_hickle.py(4KB)
--------make_gaps_training.py(2KB)
--------score_vs_holdout.py(2KB)
--------make_holdout_files.py(2KB)
--------billion()
--------quick-test.py(477B)
----theano.cpu.rc(1KB)
----theano.cuda-sandbox.rc(586B)
----go_src()
--------notes.txt(6KB)
--------vocab.go(4KB)
--------Makefile(176B)
--------splitter_words.go(8KB)
--------billion.go(8KB)
--------splitter.go(6KB)
--------levenshtein.go(1KB)
----LICENSE.txt(11KB)
----README.md(2KB)
----.geany()
--------project-tree-layout.ini(1KB)
----glove()
--------demo-glove.sh(1KB)
----docs()
--------2015-01-15_Presentation-PyDataSG()
----ipython()
--------test.ipynb(27KB)
----theano.cuda-gpuarray.rc(171B)