新浪微博数据挖掘方案

时间:2015-05-28 07:15:03
【文件属性】:

文件名称:新浪微博数据挖掘方案

文件大小:848KB

文件格式:PDF

更新时间:2015-05-28 07:15:03

新浪微博 数据挖掘 方案

随着新浪微博用户群体的增长, 新浪微博的数据获 取是微博研究首先需要解决的问题。该文提出了基于新浪 微博API 与基于页面解析的新浪微博数据获取方案。程序 逻辑控制API 调用方法与频率, 获取JSON 对象并解析实现 高效数据获取。同时将传统的网络爬虫结合网页解析技术 结合API 同时使用, 解决了因API 接口开放不完善, 且因在 返回结果数量上限与调用频率方面的限制, 导致不能有效实 现新浪微博数据的全面获取的问题。经过实验测试, 通过2 套方案的结合可以实现新浪微博数据高效全面的获取。


网友评论

  • 有一定的参考价值,内容不够具体
  • 师兄hugo的论文啊。但是能谈的更具体就更好了。
  • 思路是对的 但是随着微博的下降 可用性就降低了
  • 网络爬虫如何应用在html中并结合API采集数据?没有具体些详细
  • 对新版的新浪微博完全没用了
  • 讲的不是很详细,没很大收获
  • 希望能够在细化一点,可读性稍弱。
  • 还是比较抽象啊!
  • 做这个方面的,感觉挺不错的.
  • 太粗略仅有点理论参考价值
  • 技术细节还需详细一点
  • 感觉一般,还是有借鉴意义的
  • 整体性还可以,但是没有提供技术细节啊。。。
  • 结果很一般
  • 看起来比较吃力,感觉不详细