doc2vec:使用Doc2Vec嵌入的长文本表示和分类

时间:2024-02-26 10:47:30
【文件属性】:

文件名称:doc2vec:使用Doc2Vec嵌入的长文本表示和分类

文件大小:12.96MB

文件格式:ZIP

更新时间:2024-02-26 10:47:30

sentiment-analysis text-classification scikit-learn gensim nlp-machine-learning

Doc2Vec文本分类 文本分类模型,该模型使用gensim Doc2Vec生成段落嵌入,并使用scikit-learn Logistic回归进行分类。 数据集 25,000个IMDB电影评论,特别选择用于情感分析。 评论的情绪是二进制的(1表示肯定,0表示否定)。 与以下出版物相关联地收集了此源数据集: Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). "Learning Word Vectors for Sentiment An


【文件预览】:
doc2vec-master
----models()
--------classifier_model.py(3KB)
--------model.py(261B)
--------__init__.py(0B)
--------doc2vec_model.py(4KB)
----requirements.txt(63B)
----.travis.yml(155B)
----LICENSE(1KB)
----README.md(1KB)
----text_classifier.py(2KB)
----classifiers()
--------__init__.py(0B)
----data()
--------__init__.py(0B)
--------dataset.csv(32MB)
----.gitignore(2KB)

网友评论

  • 用户下载后在一定时间内未进行评价,系统默认好评。
  • 用户下载后在一定时间内未进行评价,系统默认好评。