文件名称:从arXiv-paper-titles生成类别:该项目采用arXiv数据集,并根据arXiv文章标题创建自动标签分类器。
文件大小:24.28MB
文件格式:ZIP
更新时间:2024-02-24 19:11:34
natural-language-processing deep-learning tensorflow scikit-learn gcp
从arXiv纸张标题生成类别 该项目采用并根据arXiv论文标题构建自动标签分类器。 系统输入:走向广泛学习:医疗保健实验 系统输出: stat.ML , cs.LG 到上述论文。
【文件预览】:
Generating-categories-from-arXiv-paper-titles-master
----Data_gathering_arXiv_tags.ipynb(25KB)
----Data_preprocessing_and_model_building (part I).ipynb(21KB)
----Data_preprocessing_and_model_building (part II).ipynb(41KB)
----EDA_and_data_splitting.ipynb(3.76MB)
----data()
--------meta.tsv(45KB)
--------y_test.npy(152KB)
--------arXivdata.csv(3.83MB)
--------X_test.npy(500KB)
--------y_train.npy(608KB)
--------X_train.npy(1.96MB)
--------vecs.tsv(1.13MB)
--------x_train_counts.csv(4KB)
----arxivdataset.zip(18.33MB)
----LICENSE(1KB)
----TPU_Experimentation.ipynb(33KB)
----checkpoints()
--------model-1572582269.1168694.h5(781KB)
--------model-1572578545.0682206.h5(1.49MB)
----.ipynb_checkpoints()
--------Data_preprocessing_and_model_building (part II)-checkpoint.ipynb(41KB)
----README.md(446B)
----utils()
--------utils.py(762B)
--------__init__.py(0B)
--------config.py(2KB)
----Text Prediction Callback.ipynb(16KB)