ThinkCrawler:一个简单的爬虫,用来抓取一些新闻

时间:2024-07-23 07:39:39
【文件属性】:

文件名称:ThinkCrawler:一个简单的爬虫,用来抓取一些新闻

文件大小:12KB

文件格式:ZIP

更新时间:2024-07-23 07:39:39

PHP

简单的新闻爬虫 现在它可以将 url 保存到 mysql 将html文件保存到dest文件夹


【文件预览】:
ThinkCrawler-master
----string_lib.class.php(633B)
----config.php(304B)
----url.class.php(4KB)
----doc()
--------db.sql(372B)
----crawler_lib()
--------curl.class.php(3KB)
--------query.php(475B)
--------file_lib.class.php(509B)
--------domain.class.php(2KB)
--------mysql()
----test()
--------domain.php(823B)
----README.md(92B)
----index.php(3KB)

网友评论