Search_Results_Relevance:Kaggle竞赛名为“搜索结果相关性”的解决方案

时间:2024-06-07 01:05:00
【文件属性】:

文件名称:Search_Results_Relevance:Kaggle竞赛名为“搜索结果相关性”的解决方案

文件大小:89KB

文件格式:ZIP

更新时间:2024-06-07 01:05:00

Python

解决方案 ### 1。 文本预处理小写转换停用词消除词干查询范围(* 1) ### 2。 特征工程q_len; 查询词长t_len; 标题字长d_len; 说明文字长度 nleven1; 查询与标题之间的标准化levenshtein距离(最短对齐) nleven2; 查询和标题之间的标准化levenshtein距离(最长对齐) 索伦森查询与标题之间的距离贾卡德查询和标题之间的jaccard距离ncd; 查询和标题之间的归一化压缩距离cos_dist_1_100; 查询和标题之间的TF-IDF余弦距离(ngram = 1,svd_component = 100) cos_dist_1_250; 查询和标题之间的TF-IDF余弦距离(ngram = 1,svd_component = 250) cos_dist_1_500; 查询和标题之间的TF-IDF余弦距离(ngram = 1,svd


【文件预览】:
Search_Results_Relevance-master
----process.png(84KB)
----model_rf.py(1KB)
----feature.py(5KB)
----README.md(4KB)
----preprocess.py(2KB)
----model_stacking.py(5KB)
----model_svm.py(1KB)
----model_gb.py(2KB)

网友评论