*-media-mining:* 平台上的社交媒体挖掘项目

时间:2024-07-13 12:12:09
【文件属性】:

文件名称:*-media-mining:* 平台上的社交媒体挖掘项目

文件大小:8.99MB

文件格式:ZIP

更新时间:2024-07-13 12:12:09

Python

* 赏金分析 在这个项目中,我们的目标是分析赏金对一个问题的影响。 我们将尝试预测一个问题在设置赏金后是否会得到成功的答案。 此外,我们预测此赏金问题是否会在创建赏金后的 2.5 天内收到获胜答案。 该项目由四部分组成: 将 * 转储导入 HANA 数据库的脚本(Python/SQL)。 SO 转储作为 XML 数据给出,将被评估并插入到数据库 (DB) 中。 用于计算附加表的 SQL 脚本,这些表可以轻松访问更深入的知识,例如关于问题的标签。 用于计算特征和训练主题模型 (LDA) 和 SVM 的代码,它们将作为 Web 服务器的知识库。 用于输入问题并接收预测作为输出的 Web 服务器。 存储库内容: 小路 data_cleansing/ 用于清除 SO 转储不一致的 SQL 脚本。 此外,创建包含精简信息的附加表。 d


【文件预览】:
*-media-mining-master
----application.cfg(91B)
----*_data.cfg(764B)
----presentations()
--------end_presentations.key(2.56MB)
--------idea_presentation.key(1.93MB)
--------*_Prototype.user.js(664B)
--------end_presentations.pdf(715KB)
--------papers_presentation.key(2.59MB)
----data_crawling()
--------src()
--------build.sbt(955B)
--------readme.md(264B)
----web_server()
--------embed-*.js(940B)
--------server.py(5KB)
--------embed-*-example.html(353B)
--------templates()
--------static()
----install.sh(2KB)
----prediction()
--------bounty_features.py(2KB)
--------chunking.py(5KB)
--------comment_features.py(1KB)
--------extended_text_features.py(4KB)
--------tag_features.py(4KB)
--------csv_reader.py(1KB)
--------utils.py(1KB)
--------text_features.py(4KB)
--------tag_aggregation_feature.py(6KB)
--------__init__.py(0B)
--------prediction_svm.py(8KB)
--------text_statistics.py(3KB)
--------database.py(4KB)
--------syllablecounter.py(6KB)
--------topic_model.py(6KB)
--------lda_model_reader.py(487B)
----run.sh(1KB)
----insert_data()
--------0-create-so-tables.sql(2KB)
--------insert_data.py(2KB)
--------build_feature_table.py(4KB)
----train.sh(396B)
----feature_analysis()
--------boxplot-mysql.R(2KB)
--------plots()
--------boxplot-csv-superscript.R(468B)
--------boxplot-csv.R(504B)
--------r-analysis.Rproj(205B)
--------presentation plots()
----prediction_scores.md(1KB)
----data_converter()
--------import_into_db.py(981B)
--------console.py(2KB)
--------__init__.py(0B)
--------assets()
--------xml2sql.py(3KB)
----README.md(9KB)
----libs()
--------ngdbc.jar(783KB)
----data_cleansing()
--------1-questions-to-many-bounties.sql(1003B)
--------2-posts-without-owner.sql(181B)
--------5-remove-inconsistent-bounties.sql(2KB)
--------7-create-tag-subscribers-table.sql(3KB)
--------0-votes-without-question.sql(183B)
--------3-create-bounty-table.sql(4KB)
--------4-import-corrected-dates.sql(324B)
--------8-insert-sql-features.sql(4KB)
--------0-index-creation.sql(535B)
--------6-create-training-featue-table.sql(4KB)
----hana_nodejs_import()
--------importXML.js(6KB)
--------package.json(377B)
----.gitignore(307B)

网友评论