a-extractor:文章内容提取数据库

时间:2024-05-23 18:32:03
【文件属性】:

文件名称:a-extractor:文章内容提取数据库

文件大小:276KB

文件格式:ZIP

更新时间:2024-05-23 18:32:03

database extraction readability JavaScript

:page_with_curl: 物品提取器 用于从博客和文章中提取内容的表达式数据库。 为了方便起见,主数据库为格式,这是Javascript的集,也可以作为常规JSON使用。 提取表达式是 ,与jQuery类似。 目标信息是: 作者 撰写本文的日期 当然,文章文字也要尽可能整洁 该项目旨在与一起使用,但是您可以根据需要使用它。 共有86个域名 abcnews.go.com 永旺 agroinfo.ro arenait.net arstechnica.com Articles.latimes.com artsy.net bbc.com beta.theglobeandmail.com bigthink.com 结合蛋白 bossfeed.net businessinsider.com 集体意识网 curentul.info dailymail.co.uk deepdotweb.com


【文件预览】:
a-extractor-master
----.travis.yml(34B)
----index.js(2KB)
----package.json(831B)
----test()
--------serious.tests.js(765B)
--------mocha.opts(58B)
--------main.tests.js(2KB)
--------fixtures()
----LICENSE(1KB)
----package-lock.json(122KB)
----database.json(13KB)
----database.json5(12KB)
----.gitignore(913B)
----README.md(4KB)
----script()
--------sort_db.js(392B)
--------sync_readme.js(543B)
--------dl_test_article.js(1KB)

网友评论