文件名称:ThinkCrawler:一个简单的爬虫,用来抓取一些新闻
文件大小:12KB
文件格式:ZIP
更新时间:2024-07-23 07:39:39
PHP
简单的新闻爬虫 现在它可以将 url 保存到 mysql 将html文件保存到dest文件夹
【文件预览】:
ThinkCrawler-master
----string_lib.class.php(633B)
----config.php(304B)
----url.class.php(4KB)
----doc()
--------db.sql(372B)
----crawler_lib()
--------curl.class.php(3KB)
--------query.php(475B)
--------file_lib.class.php(509B)
--------domain.class.php(2KB)
--------mysql()
----test()
--------domain.php(823B)
----README.md(92B)
----index.php(3KB)