毕设 大数据电影数据分析与可视化系统(源码+论文)-2 设计概要

时间:2024-10-08 06:59:48

一. 研究内容
(1)对豆瓣top250的影片信息的爬取
(2)对爬取到的数据进行预处理,剔除不良数据
(3)对爬取到的信息进行分类整理,统计电影的国家、评分、类型、评价人数、导演、参演演员信息等。
(4)绘制数据图形。
(5)验证设计的模块,项目整合,完成可行性测试。

二. 实现的模块功能
(1)抓取top250电影的上映时间、国家、评分、类型、评价人数、导演、参演演员信息;
(2)豆瓣top250电影评价人数统计柱状图
(3)豆瓣Top250电影产源国家数量占比饼图
(4)Top250电影导演作品数top10统计柱状图
(5)Top250电影类型数量占比饼图
(6)Top250影片优秀演员参演统计漏斗图
(7)Top250影片作品评分折线图
(8)Top250影片词云图

三. 研究方法
运用网络爬虫爬取豆瓣电影数据,存入csv文件中,连接数据库,利用flask框架搭建系统,配置数据库与开发环境,测试系统可行性。

大数据背景下电影数据的可视化与分析的主要开发模块主要包括数据收集模块,数据清洗模块,数据保存模块,连接数据库模块,数据可视化模块,该系统的系统模块如图一所示

在这里插入图片描述

篇幅有限,更多详细设计见设计论文