文件名称:python人人网信息抓取与数据挖掘
文件大小:10.08MB
文件格式:ZIP
更新时间:2019-11-16 07:54:10
Python,源码
人人网信息抓取与数据挖掘 人人网安全措施加强了,无法抓取原本没有权限访问的内容了。 不过,通过浏览器可以访问的内容,依旧可以抓取。 环境要求 ubuntu/win7/xp 皆可。 python3.2 --> python2.7 igraph/pycairo: 作图依赖该组件。 ubuntu 下使用 apt-get install python3-igraph 即可。 win32 版本下载并安装 igraph pycairo mysql: 仅当使用mysql作为存储介质依赖该组件。
【文件预览】:
renren-master
----.gitmodules(0B)
----net_graph.py(987B)
----config()
--------spider.ini(132B)
--------grabrr.py(5KB)
--------mysql.ini(1KB)
----spider.py(5KB)
----test_net_graph.png(58KB)
----repo_file.py(2KB)
----test_parse.py(12KB)
----downloader.py(4KB)
----settings.py(256B)
----parse.py(8KB)
----.gitignore(427B)
----get_info.py(2KB)
----requirement.txt(22B)
----repo_mysql.py(5KB)
----README.md(8KB)
----topic()
--------jieba()
--------demo.py(5KB)
--------nstatus_nkeyword.png(40KB)
--------jieba-master.zip(5MB)
--------README.md(81B)