studies:进行数据科学研究的资料库

时间:2021-03-11 12:58:30
【文件属性】:
文件名称:studies:进行数据科学研究的资料库
文件大小:299KB
文件格式:ZIP
更新时间:2021-03-11 12:58:30
JupyterNotebook 锡达塔的肖像 01_WebScraping_FIFA21_8min 一种简单的代码,可从一个具有不同页面的网站收集数据(FIFA 21-8分钟战斗)。 收集页面后,它将保存一个带有结构化数据(数据集)的.CSV文件。 02_MachineLearning_VotingClassifier_FraudDetection 这项研究显示了如何使用SMOTE作为重采样策略并通过投票分类器来计算概率来预测欺诈(高度不平衡的数据)。 我使用LogisticRegression,RandomForestClassifier,DecisionTreeClassifier和GradientBoostingClassifier来填充投票分类器。 03_DeepLearning_NLP_垃圾邮件检测 这项研究提出了一种建立文本分类模型的方法(我使用了20个新闻组数据集)。 作为特征提取策略,我提取了令牌的T
【文件预览】:
studies-master
----01_WebScraping_FIFA21_8min()
--------FIFA21_8min_history.csv(65KB)
--------WebScraping_FIFA21_Battle8min.ipynb(24KB)
--------.gitignore(21B)
----readme.md(786B)
----03_NLP_TextClassification()
--------01_TextClassification_NLP_ML.ipynb(182KB)
----02_MachineLearning_VotingClassifier_FraudDetection()
--------FraudDetection_VotingClassifier_SMOTE.ipynb(241KB)
--------.gitignore(5B)

网友评论