评论分析

时间:2024-02-25 01:11:15
【文件属性】:

文件名称:评论分析

文件大小:28.2MB

文件格式:ZIP

更新时间:2024-02-25 01:11:15

nlp machine-learning jupyter-notebook social-network-analysis JupyterNotebook

评论分析 该项目的主要目标是通过用户在社交网络社区中的评论来确定用户的毕业能力。 使用了许多机器学习和自然语言处理技术。 数据集包含来自12k个不同用户的180k条注释。 最终解决方案代表了最佳模型的集合,这些模型可以预测用户的每个评论的类别。 首先,确定来自用户的每个评论的类别。 此后,可以通过投票分类器来获得用户的类别。 演示视频: : scripts.py-用于从社交网络(VK)下载数据的模块。 EDA-具有数据浏览功能,清理数据并为机器学习算法准备数据的笔记本。 DifferentModels-带有大量nlp模型的笔记本,用于预测每个注释的类。 注释的不同表示形式:BOW


【文件预览】:
CommentsAnalysis-master
----.gitignore(1KB)
----DifferentModels.ipynb(2.14MB)
----data_for_app()
--------best_comments.pkl(1.16MB)
--------av_model.pkl(65.03MB)
----templates()
--------index.html(6KB)
----requirements.txt(83B)
----models_bin()
--------dictionary_filtered(254KB)
--------lda.id2word(315KB)
--------lda(75KB)
--------lda.state(2.68MB)
--------lda.expElogbeta.npy(1.83MB)
----meta_data()
--------vrn_fac_raw.txt(11KB)
--------names.txt(23KB)
--------vrn_fac.txt(9KB)
--------emoji.txt(55KB)
--------names_from_sent.txt(9KB)
----static()
--------script.js(6KB)
--------pic.jpg(90KB)
--------jumbotron-narrow.css(1KB)
--------script - копия.js(3KB)
--------favicon.ico(850B)
----EDA.ipynb(392KB)
----scripts()
--------loader.py(20KB)
--------__init__.py(0B)
--------models.py(4KB)
--------fit_predict.py(5KB)
----runtime.txt(12B)
----cache()
--------model.json(3KB)
----README.md(1KB)
----demo.gif(113KB)
----ShortCommentsExperiments.ipynb(335KB)
----Procfile(42B)
----main.py(2KB)
----tmp()
--------.gitkeep(0B)
----FinalSolution.ipynb(459KB)
----TestingModule.ipynb(6KB)
----logs()
--------sample.txt(35KB)
--------score.txt(2KB)

网友评论