文件名称:hotel-review-analysis:使用配备MonkeyLearn的机器学习模型进行酒店点评的情感分析和方面分类
文件大小:22KB
文件格式:ZIP
更新时间:2024-06-08 01:23:58
Python
酒店评论的情感分析和方面分类 这是MonkeyLearn系列文章的源代码,这些文章与使用机器学习模型分析酒店评论中的情绪和方面有关。 此代码在python2.7中运行。 (2018年5月更新-自从编写了这些蜘蛛以来,TripAdvisor和Booking.com对其网站进行了很大的更改,因此它们不再起作用。博客文章和代码对于作为如何构建Scrapy蜘蛛的示例仍然非常有用,但可悲的是,示例本身已不再起作用。我们将来可能会修复蜘蛛程序,因为它可能足以更新所有选择器以使所有功能再次正常工作。) 代码组织 该项目本身是一个Scrapy项目,用于从TripAdvisor和Booking等不同站点收集培训和测试数据。 此外,还有一系列Python脚本和Jupyter笔记本实现了一些必要的脚本。 TripAdvisor(hotel_sentiment / spider / tripadvisor_sp
【文件预览】:
hotel-review-analysis-master
----scrapy.cfg(274B)
----csv_monkey_converter.py(928B)
----opinionTokenizer.py(3KB)
----README.md(4KB)
----classify_elastic()
--------classify_pipe.py(1KB)
--------Extract keywords.ipynb(4KB)
--------index_reviews.py(2KB)
--------queries()
--------index_opinion_units.py(1KB)
--------opinionTokenizer.py(3KB)
--------generate_files_for_indexing.py(1010B)
--------index_definition.json(1KB)
----classify_and_plot_reviews.ipynb(6KB)
----.gitignore(32B)
----hotel_sentiment()
--------settings.py(3KB)
--------pipelines.py(294B)
--------__init__.py(0B)
--------items.py(1KB)
--------spiders()