我们团队的作业是:百度贴吧小爬虫
- 队员学号:
龙江腾(队长) 201810775001
杨希 201810812008
何敬上 201810812004
1.需求分析
- 用户调研
我们针对的用户人群是百度贴吧使用者,所以我们特意在各大贴吧中对我组作业进行网上需求调查,
回复数量众多。以下是调查问卷链接地址:
http://tieba.baidu.com/p/5946030918
http://tieba.baidu.com/p/5946029887?qq-pf-to=pcqq.group
- 完成《需求规格说明书》并上传到团队coding;
https://coding.net/u/dhlg_201810812008/p/teamWorkByThree/git/tree/master/
- 完成项目NABCD写作;
1) N (Need 需求)
1、对特定的贴吧爬取发帖主题人的主题回复数据。
2、实现分析和统计得到结果。
3、能够文本进行连接,将爬下的数据文本中。
4、将爬下的发帖主题人信息进行图形化显示。
2) A (Approach 做法)
我们会在各大贴吧推广试用,让各个贴吧网友免费试用开拓市场。持续维护用户需求,对程序代码进行改进优化。
在很多时候我们会在贴吧发帖,使用爬虫中有趣的功能,吸引新用户群体。
3) B (Benefit 好处)
在有一定的用户积累之后,我们可以在软件界面上植入广告获得一定的收入,也可以增加VIP功能,对收费用户提供更优质的服务。
4) C (Competitors 竞争)
目前网上爬虫较多,各种功能都有。但是专注于贴吧主题爬虫确没有,这个是我们独特的优势。
5) D (Delivery 交付, Data 数据)
在交付推广的过程中,我们会在各大贴吧进行发帖宣传,让网友体验我们爬虫功能。如果一个贴吧能够吸引3-5个用户,推广一百个贴吧就能够
拥有数百个固定的用户群体。对于我们市场开拓非常有利。
- 团队分工:
龙江腾(队长)
占任务工作量40%,完成需求规格说明书编写,完成NABCD写作。
杨希
占任务工作量30%,完成百度贴吧小爬虫程序原型设计。
何敬上
占任务工作量30%,完成百度贴吧小爬虫程序需求功能问卷调查。
2.原型设计:
前台界面如下图所示:
使用爬虫之后,会得到如下数据结果显示:
原型代码已经上传到coding,地址如下: https://coding.net/u/dhlg_201810812008/p/teamWorkByThree/git/tree/master/%E5%8E%9F%E5%9E%8B%E8%AE%BE%E8%AE%A1%E4%BB%A3%E7%A0%81%E5%8F%8A%E9%A1%B5%E9%9D%A2%E6%88%AA%E5%9B%BE
3.编码规范:
使用Python程序设计PEP8规范,细则上传到团队coding:
https://coding.net/u/dhlg_201810812008/p/teamWorkByThree/git/tree/master/