文件名称:Qt 网站爬虫源码
文件大小:7KB
文件格式:RAR
更新时间:2022-04-20 14:38:36
Qt
程序思路如下: 1.下载要爬网站的页面。 2.用正则表达式去掉空格,使得程序处理得快。 3.因为CSDN博客文章前面的链接都一样,所以我们只要提取尾部文章编号。 (如:http://blog.csdn.net/qq78442761/article/details/xxxxxxxx) 4.扫描整个文件,得到文章标题。 5.保存为csv格式文件
【文件预览】:
Qt 网站爬虫源码
----NetReptile.pro(409B)
----widget.h(1KB)
----widget.ui(6KB)
----main.cpp(175B)
----NetReptile.pro.user(23KB)
----widget.cpp(7KB)