element-annotator:Web代理元素注释器界面

时间:2024-06-07 00:31:48
【文件属性】:

文件名称:element-annotator:Web代理元素注释器界面

文件大小:118KB

文件格式:ZIP

更新时间:2024-06-07 00:31:48

JavaScript

数据采集 短语节点数据收集过程: 第1步:保存网页 tools/extension :使用Allan的Chrome扩展程序保存网页 (待办事项:有关如何使用的更多详细信息) 在后台,Allan的服务器保存所有资源 步骤2:清理网页 tools/convert-allan-html.py :批量清理网页 该脚本删除了危险标签( script , iframe等) 该脚本还为每个标签添加了唯一的data-xid属性 tools/page-filter :查看页面并删除不良页面 启动服务器tools/page-filter/server.py ,指定一个文件以转储错误的URL。 使用启动另一个简单服务器,以在该目录中的http://127.0.0.1:8080提供静态文件。 转到http://127.0.0.1:8080 。 单击网页以查看它。 如果不正确,请单击X。URL将被转储到


【文件预览】:
element-annotator-master
----.gitignore(2KB)
----nodemon.json(27B)
----ice.sh(2KB)
----README.md(2KB)
----test()
--------services()
--------app.test.js(1KB)
----public()
--------css()
--------.gitignore(42B)
--------README.md(330B)
--------validator.html(3KB)
--------js()
--------index.html(3KB)
--------favicon.ico(5KB)
--------viewer.html(795B)
----package.json(1KB)
----src()
--------services()
--------app.hooks.js(489B)
--------middleware()
--------app.js(1KB)
--------models()
--------index.js(383B)
--------hooks()
----config()
--------default.json(143B)
--------production.json(71B)
----README.old.md(1KB)
----tools()
--------check-css.py(1KB)
--------generate-validator-data.py(2KB)
--------extract-node-texts.py(1KB)
--------download-css.py(1KB)
--------extension()
--------convert-allan-html.py(3KB)
--------compute-equivalence.py(2KB)
--------batch-copy-files.py(1KB)
--------language-filter.py(901B)
--------unarchive.py(2KB)
--------page-filter()
----.npmignore(594B)
----.editorconfig(214B)
----.eslintrc.json(334B)

网友评论