文件名称:classifying-text:用词袋对文本进行分类
文件大小:9KB
文件格式:ZIP
更新时间:2024-06-15 07:09:46
Python
分类文本 使用来自Kaggle竞赛的数据,用单词袋对文本进行分类:。 原始Kaggle教程的改进版本。 bow_predict.py - train and predict, save a submission file bow_validate.py - create train/test split, train, get validation score bow_validate_tfidf.py - an improved validation script, with TF-IDF and n-grams fofe - a directory containing FOFE vectorizer and sample code fofe_validate.py - validation scores for count vectorizer vs FOFE KaggleWor
【文件预览】:
classifying-text-master
----KaggleWord2VecUtility.py(2KB)
----fofe()
--------fofe.py(1KB)
--------__init__.py(0B)
--------sample.txt(150B)
--------driver.py(618B)
----fofe_validate.py(2KB)
----bow_predict.py(1KB)
----LICENSE(1KB)
----bow_validate.py(3KB)
----README.md(2KB)
----bow_validate_tfidf.py(2KB)
----data()
--------README.md(80B)