toxic_comment_classification:在野外预测有毒评论

时间:2024-05-15 08:46:56
【文件属性】:

文件名称:toxic_comment_classification:在野外预测有毒评论

文件大小:2.92MB

文件格式:ZIP

更新时间:2024-05-15 08:46:56

JupyterNotebook

有毒评论分类 这是我在主持的有毒评论分类比赛的代码。 从的基本代码完全修改到另一个级别 要下载数据集,请运行get_data.sh 任务 数据集包含来自Wikipedia对话页编辑的评论。 这是大量的*评论,被人类评分者标记为有毒行为。 毒性类型为: toxic severe_toxic obscene threat insult identity_hate 该方法 创建一个整体模型来预测每种评论的每种毒性的可能性。 记录了我的方法的完整解释 安装先决条件 运行install.sh,然后运行pip install -r requirements.txt 尖端 确保使用嵌入原始预处理,以确保可以导入最高百分比的嵌入


【文件预览】:
toxic_comment_classification-master
----Train Toxicity Model.ipynb(502KB)
----ensemble.ipynb(93KB)
----LGBM_LOGREG_XGB_STACK_LOGREG.ipynb(64KB)
----RIDGE.ipynb(19KB)
----nbsvm.ipynb(7.56MB)
----get_data.sh(214B)
----nbsvm.py(1KB)
----EXTRATREES_CLASSIFIER.ipynb(131KB)
----install.sh(197B)
----model_tool.py(75KB)
----super_nbsvm.ipynb(10KB)
----requirements.txt(60B)
----badwords.ipynb(10KB)
----Untitled.ipynb(19KB)
----feature_engineering.ipynb(72KB)
----visuals.py(5KB)
----bagging.ipynb(82KB)
----sample_submission.csv(5.99MB)
----README.md(1KB)
----translate.ipynb(2KB)
----convai_feature.ipynb(7KB)
----fasttext_direct.ipynb(44KB)
----HillCLIMBENSEMBLE.ipynb(435KB)
----conv.ipynb(108KB)
----add_covaai.ipynb(18KB)
----XGBOOST.ipynb(166KB)

网友评论