crowdflower-search:Kaggle比赛

时间:2024-06-10 07:12:54
【文件属性】:

文件名称:crowdflower-search:Kaggle比赛

文件大小:1.52MB

文件格式:ZIP

更新时间:2024-06-10 07:12:54

Python

准备中 安装R软件包: RWeka stringr readr stringdist tm qdap SnowballC combinat e1071 xgboost h2o R RWeka stringr readr stringdist tm qdap SnowballC combinat e1071 xgboost h2o 安装Python软件包pandas numpy keras Levenshtein BeautifulSoup nltk 下载Word2vec Google新闻( https://drive.google.com/file/d/0B7XkCwpI5KDYNlNUTTlSS21pQmM/edit?usp=sharing )解压缩并将链接放入word2_vec_test.py中的第89行 数据清理 Rscript cleanData_02.R 产生特征 pyt


【文件预览】:
crowdflower-search-master
----ann10b_ver2.py(2KB)
----create_modeling_set_09.R(1KB)
----.gitignore(37B)
----ngramMatches_product_01.R(2KB)
----h2o_training_v20150616.R(7KB)
----ann_alt.py(2KB)
----masterset_v04.R(5KB)
----createFeatures07_Ngram_match.R(6KB)
----ann_wm_c1r2.py(2KB)
----dict_for_clean.py(2KB)
----ngramMatches07_alt_queries.R(2KB)
----extractProductName_NEW.R(7KB)
----ann_250_tfidf.py(2KB)
----Okapi.R(1001B)
----ngramMatches07.R(3KB)
----svm_alejandro.py(8KB)
----auto_correct.py(2KB)
----word2_vec_test.py(5KB)
----create_ensemble.R(1KB)
----Xgboost_training_v10c.R(3KB)
----RelevanceGroup.py(13KB)
----ann10b.py(2KB)
----utils.py(8KB)
----Xgboost_training_v11.R(3KB)
----ensemblenn.py(2KB)
----kagg_distance.py(4KB)
----ann_1234_7_ver2.py(2KB)
----ann10b_noamazon.py(2KB)
----ann_tfidf.py(2KB)
----readme.md(2KB)
----create_modeling_set_08c.R(1KB)
----extract_TF_IDF.py(10KB)
----AddProps3.py(3KB)
----svm_model_v20150703.R(5KB)
----create_modeling_set_08.R(1KB)
----alt_query.R(2KB)
----generate_5fold_keys.R(273B)
----create_modeling_set_08b.R(1KB)
----Xgboost_training_v10.R(3KB)
----create_modeling_set_10.R(1KB)
----utils_pre.py(8KB)
----create_Okapi.R(2KB)
----word_features.py(1KB)
----tuning()
--------xgboost_logfile12.RData(2KB)
--------xgboost_logfile10b.RData(1KB)
--------svm_radial_reg_02.Rdata(421B)
--------h2o_log_01.RData(231KB)
--------xgboost_logfile11.RData(2KB)
--------xgboost_logfile10.RData(1KB)
--------xgboost_logfile10c.RData(2KB)
----doc()
--------Quartet - No Free Hunch blog.pdf(1.22MB)
----AddProps2.py(3KB)
----knn_bagging_5.py(2KB)
----AddProps.py(4KB)
----Xgboost_training_v12.R(3KB)
----SVM_final.py(15KB)
----rf_bagging_5.py(2KB)
----ann_alt_ngram_wm.py(2KB)
----Xgboost_training_v10b.R(3KB)
----myml()
--------kaggle_util.py(184B)
--------rocutils.py(279B)
--------visual.py(4KB)
--------files.py(727B)
--------pipe.py(849B)
--------nn.py(5KB)
--------cvpredict.py(1KB)
--------metrics.py(9KB)
--------semisup.py(685B)
--------cvfx.py(407B)
--------ensemble.py(3KB)
--------utils.py(2KB)
--------m2mensemble.py(2KB)
--------EnsembleClassifiers.py(8KB)
--------__init__.py(2B)
--------bagging.py(586B)
--------FunctionTransformer.py(1KB)
--------ensemble2.py(7KB)
----cleanData_02.R(6KB)

网友评论