文件名称:solution_for_cikm_cup_2014:2014 cikm杯第5名解决方案
文件大小:59KB
文件格式:ZIP
更新时间:2024-07-18 05:35:28
Python
Fancyspeed 为 CIKM2014 Cup 提供的解决方案(第 5 名)。 背景 任务是查询分类或查询意图检测。 大赛详情请访问和 挑战 多类多标签 短文 点击和会话 未标记的数据 不平衡的数据 每个挑战的想法 结构化标签 N-gram,词位,聚合查询作为样本 会话中查询和标签、关键字和实体检测 半监督学习 采样、后处理 特征 查询词(1-gram、2-gram、词位置) 单击的标题词(1-gram,2-gram) 查询相同会话中前 30 个标题的单词 查询相同会话中前 3 个标签的单词 查询相同会话中的标签 查询长度 查询频率 点击标题的平均长度 查询相同会话中的平均搜索时间 查询相同会话中的平均点击次数 在查询的相同会话中平均重复点击 方法和工具 GBM:带有 softmax 目标的 Xgboost SVC:*线性 多类 LR:Sklearn.MultiTaskLas
【文件预览】:
solution_for_cikm_cup_2014-master
----README.md(2KB)
----V2()
--------trans_train0.py(6KB)
--------run_liblinear_dog.sh(489B)
--------trans_train2.py(7KB)
--------prepare_ensemble_cat.py(4KB)
--------prepare_ensemble_dog.py(4KB)
--------construct_liblinear_b1.py(892B)
--------run_semilda.sh(2KB)
--------run_session_label.sh(440B)
--------prepare_feature_pig1.py(10KB)
--------refine_train_by_sesson_query.py(1KB)
--------construct_maxprob.py(1KB)
--------run_liblinear_pig.sh(346B)
--------trans_train1.py(6KB)
--------metric_F1.py(3KB)
--------xgboost3.conf(2KB)
--------construct_session_prob.py(2KB)
--------split_train.py(2KB)
--------run_xgboost3_pig.sh(541B)
--------prepare_lda_train.py(2KB)
--------run_ensemble.sh(1KB)
--------prepare_session.py(6KB)
--------prepare_feature_dog1.py(10KB)
--------run_prepare.sh(310B)
--------prepare_lda_test.py(1KB)
--------run_xgboost3_dog.sh(812B)
--------prepare_ensemble_pig.py(4KB)
--------run_all.sh(152B)
--------construct_semilda.py(1KB)
--------construct_maxprob_multi.py(1KB)
--------markov_sessoin_label.py(3KB)
--------trans_session.py(3KB)
----V1()
--------trans_train2.py(7KB)
--------metric_confusion.py(2KB)
--------run_xgboost3_pig2.sh(532B)
--------construct_liblinear_b1.py(892B)
--------run_liblinear_multi.sh(559B)
--------refine_train_by_sesson_query.py(1KB)
--------run_xgboost3_session.sh(583B)
--------construct_maxprob.py(1KB)
--------run_semilda_pig.sh(1KB)
--------run_liblinear_pig.sh(592B)
--------trans_train1.py(5KB)
--------construct_maxprob_balance.py(3KB)
--------metric_F1.py(3KB)
--------run_forest_dog.sh(181B)
--------forest.py(1KB)
--------xgboost3.conf(2KB)
--------construct_session_prob.py(2KB)
--------construct_liblinear_multi.py(1KB)
--------markov_all.py(4KB)
--------split_train.py(2KB)
--------run_xgboost3_pig.sh(529B)
--------construct_maxlabel.py(805B)
--------prepare_lda_train.py(2KB)
--------prepare_session.py(6KB)
--------averaging_methods.py(3KB)
--------prepare_liblinear_1vsA.py(1KB)
--------run_average.sh(688B)
--------prepare3.py(10KB)
--------prepare_lda_test.py(1KB)
--------run_xgboost3_dog.sh(1KB)
--------construct_semilda.py(1KB)
--------construct_maxprob_multi.py(1KB)
--------prepare2.py(10KB)
--------markov_sessoin_label.py(3KB)
--------trans_session.py(3KB)
--------prepare1.py(10KB)