文件名称:pagelyzer:用于检测网页变化及其呈现的工具套件
文件大小:1.47MB
文件格式:ZIP
更新时间:2024-08-01 16:45:00
Java
页面分析器 项目概览 JKernelMachines:一个用于学习内核的 Java 库。 它主要用于处理在标准库中不容易找到的自定义内核,例如结构化数据上的内核。 这个库是由 David Picard 开发的,新版本可以在这里找到: : JDescriptors:一个用于不同颜色描述符(如 SIFT 和 HSV)的 Java 库。 这个库是在 LIP6 开发的。 MarcAlizer:一个有监督的框架。 它提取特征以创建用于训练/比较的向量,并根据向量之间的相似性计算分数。 它使用 JKernelMachines 和 JDescriptors。 Pagelyzer:截取屏幕截图、进行网页分割并使用 MarcAlizer 返回结果的主要项目。 安装依赖 $ sudo apt-get install openjdk-7-jdk $ sudo apt-get install xvfb