文件名称:基于ELMo词向量的textCNN中文文本分类python代码
文件大小:383.46MB
文件格式:ZIP
更新时间:2023-07-13 06:48:09
NLP python 文本分类 ELMo pytorch
基于ELMo词向量的textCNN中文文本分类python代码,ELMo是基于哈工大的HIT-SCIR/ELMoForManyLangs,文本分类代码是基于keras的,有数据有模型有代码。
【文件预览】:
1.ELMo_Chinese_text_classifier
----ELMoForManyLangs()
--------setup.py(375B)
--------.gitignore(1KB)
--------.git()
--------build()
--------dist()
--------README.md(10KB)
--------configs()
--------elmoformanylangs()
--------elmoformanylangs.egg-info()
----ELMo_text_classification.py(4KB)
----.ipynb_checkpoints()
--------ELMo_text_classification-checkpoint.ipynb(9KB)
----zhs.model()
--------encoder.pkl(288.25MB)
--------token_embedder.pkl(98.94MB)
--------.DS_Store(6KB)
--------word.dic(970KB)
--------char.dic(53KB)
--------config.json(479B)
----ELMo_model.h5(18.07MB)
----.DS_Store(8KB)
----utils.py(4KB)
----configs()
--------cnn_50_100_512_4096_sample.json(474B)
----.idea()
--------1.ELMo_Chinese_text_classifier.iml(464B)
--------misc.xml(294B)
--------workspace.xml(15KB)
--------vcs.xml(202B)
--------deployment.xml(370B)
--------inspectionProfiles()
--------modules.xml(319B)
----__pycache__()
--------utils.cpython-36.pyc(5KB)
----processed_data()
--------technology.txt(4.42MB)
--------sports.txt(3.72MB)
--------entertainment.txt(4.09MB)
--------car.txt(2.39MB)
--------military.txt(3.06MB)
----ELMo_text_classification.ipynb(25KB)