文件名称:portia:Scrapy的视觉抓取
文件大小:6.4MB
文件格式:ZIP
更新时间:2024-03-12 20:23:57
Python
波蒂亚 Portia是一种工具,可让您直观地抓取网站,而无需任何编程知识。 使用Portia,您可以为网页添加注释,以标识要提取的数据,Portia将基于这些注释了解如何从相似页面中抓取数据。 跑Portia 运行Portia的最简单方法是使用 : 您可以通过运行以下命令使用Docker和官方Portia-image运行Portia: docker run -v ~/portia_projects:/app/data/projects:rw -p 9001:9001 scrapinghub/portia 您还可以通过克隆此存储库并从文件夹的根目录运行,使用设置本地实例: docker-compose up 有关更详细的说明以及使用Docker的替代方法,请参阅《文档。 文献资料 可以从找到。 源文件可以在docs目录中找到。