readabilityBUNDLE, 一组html内容提取算法.zip

时间:2022-10-30 02:20:04
【文件属性】:

文件名称:readabilityBUNDLE, 一组html内容提取算法.zip

文件大小:46KB

文件格式:ZIP

更新时间:2022-10-30 02:20:04

开源

readabilityBUNDLE, 一组html内容提取算法 readabilityBUNDLE用Java编写的html主要内容提取。 它将把文章文本提取出来。最近,从html页面中提取主要文章内容是一个挑战性的开放。 有许多开源算法/实现可用。 本项目中的目标是简明地介绍在JAVA中实现的一些


【文件预览】:
readabilityBUNDLE-master
----pom.xml(2KB)
----src()
--------test()
--------main()
----README.md(3KB)

网友评论