文件名称:sklearn-practice:sklearn学习,持续更新..
文件大小:4.13MB
文件格式:ZIP
更新时间:2024-05-31 18:40:32
Python
sklearn-practice sklearn学习,持续更新... 1. 数据集 ,sklearn.datasets 2. 预处理方法 ,一些预处理方法,包括:标准化、正则化、处理缺失值、处理分类特征和处理多项式特征等。 3. 降维算法 ,降维算法的使用,包括pca、factor analysis等。利用降维算法对预训练的词向量进行降维,并验证降维的效果。 4. 特征抽取 ,特征抽取模块的使用。包括:词袋模型、tfidf和lda等。 5. 特征选择 ,特征选择模块的使用。 6. 分类算法 ,分类算法在文本分类任务上的使用。 7. 聚类算法 ,聚类算法的使用。
【文件预览】:
sklearn-practice-master
----sklearn.feature_selection()
--------select_kbest_chi2.py(2KB)
--------README.md(180B)
----sklearn.clustering()
--------kmeans.py(2KB)
--------README.md(322B)
----sklearn.feature_extraction()
--------text2tfidfvec.py(1KB)
--------text2countvec.py(1KB)
--------README.md(988B)
--------text2tfidfvec_pipeline.py(1KB)
--------text2ldavec.py(1KB)
----sklearn.preprocessing()
--------categorical_features.py(1KB)
--------polynomial_features.py(460B)
--------README.md(3KB)
--------binarization.py(360B)
--------function_transformer.py(469B)
--------normalization.py(852B)
--------std_mean_scaling.py(2KB)
--------non_linear_transformation.py(1KB)
--------missing_values.py(536B)
----README.md(1KB)
----sklearn.datasets()
--------dataset_20newsgroups.py(706B)
--------README.md(186B)
----sklearn.classification()
--------naive_bayes.py(2KB)
--------mlp_classifier_lda.py(2KB)
--------knn.py(2KB)
--------logistic_regression.py(2KB)
--------mlp_classifier.py(2KB)
--------svm.py(2KB)
--------README.md(3KB)
--------random_forests.py(2KB)
--------ada_boost.py(2KB)
----sklearn.decomposition()
--------fa_reduce_w2v_dim.py(2KB)
--------data()
--------logistic_regression.py(2KB)
--------pca_reduce_w2v_dim.py(2KB)
--------README.md(3KB)