文件名称:SmartReader:SmartReader是一个库,用于根据Mozilla可读性库的端口提取网页的主要内容
文件大小:26.82MB
文件格式:ZIP
更新时间:2024-02-25 13:24:56
csharp readability article-extracting readable article-extractor
智能阅读器 一个库,用于提取网页的主要内容,删除广告,侧边栏等。 什么和为什么 该库支持.NET Standard 2.0。 核心算法是的端口。 原始库是稳定的,可在Firefox内部生产中使用。 通过这种方式,我们可以背负Mozilla的艰苦卓绝的工作。 SmartReader还对原始库进行了一些改进,获得了更多更好的元数据: 网站名称 作者和出版日期 语言 文章摘录 特色图片 找到的图像列表(它也可以选择下载图像并将其存储为数据URI) 估计阅读本文所需的时间 它还允许在提取文章之前和之后执行自定义操作。 随时提出新功能。 安装 使用包很简单。 PM> Install-Packa