文件名称:quick_cdiscount:在https上为Cdiscount数据科学竞赛提供50%准确度的快速深度学习解决方案
文件大小:37KB
文件格式:ZIP
更新时间:2024-06-08 19:47:29
Python
quick_cdiscount 针对Cdiscount数据科学竞赛的快速50%精度深度学习模型,网址为 简短地介绍了如何仅使用深度学习技术在Cdiscount挑战中达到约50%的准确性。 步骤如下: 1-学习一个200-D word2vec模型以获取对象描述 我使用但是输出格式与原始Google实现的格式兼容。 完整的word2vec模型的二进制文件可用 [3Gb] 2-将描述,Libelle和Marque特征的向量相加,这将产生一个200-D的描述,该描述将完全替换初始数据集中的所有文本 脚本preproc_w2v.py可以执行此操作。 当心,它使用Gensim的word2vec阅读器,由于UTF8不匹配,可能需要打补丁。 要解决此问题,请将Gensim的word2vec.py第914行替换为 word = b''.join(word) 基于此脚本,您可以根据需要将单词向量用
【文件预览】:
quick_cdiscount-master
----corresp.txt(89KB)
----preproc_w2v.py(2KB)
----predict.py(8KB)
----README.md(3KB)