文件名称:Krawlr:C# & Selenium 网页爬虫
文件大小:66KB
文件格式:ZIP
更新时间:2024-07-06 15:33:56
C#
克劳尔 C# 和 Selenium 网页爬虫。 它易于使用并设计为从命令行运行。 下载 很快。 建造 下载运行源之后build.cmd导航到\Krawlr.Console\Bin\Release和繁荣有Krawlr。 用法 在克隆源和构建之后,让我们利用命令行。 // The simplest way to start the crawl $ Krawlr.exe --url http://simple-crawl.com/ // While crawling it's possible to ignore some routes by supplying a simple list of keywords to ignore $ Krawlr.exe --url http://my-awesome-site.com/ --exclude ExcludeUrls.txt // Kraw
【文件预览】:
Krawlr-master
----.gitattributes(378B)
----src()
--------Krawlr.Core()
--------Krawlr.sln(2KB)
--------Krawlr.Console()
--------Krawlr.Tests()
--------build.cmd(350B)
----scripts()
--------Krawlr-SqlServer-CreateTablesAndKeys.sql(745B)
----README.md(6KB)
----.gitignore(3KB)