hyphe:具有内置探索和控制Web界面的网站搜寻器

时间:2024-06-01 22:53:14
【文件属性】:

文件名称:hyphe:具有内置探索和控制Web界面的网站搜寻器

文件大小:39.79MB

文件格式:ZIP

更新时间:2024-06-01 22:53:14

JavaScript

Hyphe:Web语料库管理工具和链接搜寻器 欢迎来到 ,这是一个由研究驱动的Web爬虫,该爬虫是在针对。 Hyphe的目的是提供一种工具,以通过从网络中抓取数据并在我们称为“网络实体”的网络之间生成网络来构建网络语料库,该网络实体可以是单个页面,也可以是网站,子域或其中的一部分,甚至是以下各项的组合那些。 演示和Tutos 您可以在以下URL上尝试Hyphe的受限版本: ://hyphe.medialab.sciences-po.fr/demo/ 您可以在上找到广泛的教程。 另请参见这些视频,以及。 如何安装? 在运行Hyphe之前,您可能需要先调整设置。 默认配置可以使用,但您可能需要根据自己的需要进行调整。 安装后有一个更改配置的过程。 但是,我们建议您查看,以获取每个可用选项的详细说明。 警告: Hyphe可能会占用大量磁盘,具有数百个深度为2的爬网的大型主体很容易占用


网友评论