one-million-posts

时间:2024-05-06 19:57:45
【文件属性】:

文件名称:one-million-posts

文件大小:4.49MB

文件格式:ZIP

更新时间:2024-05-06 19:57:45

Python

一百万个职位 基于自然语言处理项目。 设置 安装 。 通过pyenv install 3.8.5 python 3.8.5 pyenv install 3.8.5 运行make setup 。 设置-建模 请参阅 。 设置-笔记本 笔记本以python百分比脚本格式作为.py文件推送(我们喜欢有意义的差异)。 这些文件是通过jupyter插件创建的,如果您make setup作为基本一部分make setup ,它将自动。 要获得实际的笔记本体验,请通过jupyter打开它们。 但是即使没有jupytext,您也可以通过python -m file_name.py像运行任何python文件一样运行它们。 简报 演示文稿位于./presentations/ 简报文件 描述 有关机票 , EDA 造型 在此./modeling/中可以找到模型的代码。 它们被推送为.py文件。 请参阅


【文件预览】:
one-million-posts-main
----utils()
--------visualizing.py(1KB)
--------cleaning.py(5KB)
--------feature_engineering.py(5KB)
--------loading.py(3KB)
--------scoring.py(5KB)
--------modeling.py(11KB)
--------translate_w_azure.py(6KB)
--------augmenting.py(2KB)
--------transformers.py(3KB)
--------train_test_val_split.py(2KB)
--------config_azure.py(267B)
----modeling()
--------random_forest.py(6KB)
--------config.py(349B)
--------oversampling-vs-augmentation.py(8KB)
--------naive_bayes.py(7KB)
--------model_template.py(2KB)
----output()
--------zero_shot_result_2599.csv(472KB)
--------trans_label_inappropriate.csv(481KB)
--------trans_label_personalstories.csv(6.87MB)
--------trans_label_sentimentpositive.csv(361KB)
--------trans_label_possiblyfeedback.csv(1.46MB)
--------trans_label_argumentsused.csv(599KB)
--------trans_label_discriminating.csv(615KB)
--------trans_label_sentimentnegative.csv(338KB)
--------zero_shot_result_1000.csv(181KB)
--------trans_label_offtopic.csv(374KB)
----presentations()
--------One Million Posts - Annotation composition.pdf(89KB)
----pictures()
--------baseline_paper.png(223KB)
--------positive_annotations_per_label_stacked.png(37KB)
--------num_articles_per_category.png(49KB)
--------positive_annotations_per_label.png(41KB)
--------num_articles_per_category_RdPu.png(51KB)
--------positive_annotations_per_label_with_count.png(56KB)
--------F1_scores_models_midterm.png(60KB)
--------positive_annotations_per_label_stacked_ylim1.png(39KB)
----SETUP.md(1KB)
----requirements.txt(284B)
----eda_annotation_analysis.py(5KB)
----LICENSE(1KB)
----eda_wordclouds.py(13KB)
----eda_number_of_moderators.py(701B)
----README.md(2KB)
----Makefile(503B)
----modeling_zero_shot.py(5KB)
----visualization_plot_f1_scores.py(5KB)
----eda_label_distribution.py(5KB)
----eda_posts_vs_categories.py(6KB)
----.gitignore(2KB)
----setup.sh(192B)
----first_data_exploration.py(7KB)
----eda_discussion_trees.py(4KB)

网友评论