jsoup:用于处理现实世界 HTML 的 Java 库-开源

时间:2024-07-31 13:35:17
【文件属性】:

文件名称:jsoup:用于处理现实世界 HTML 的 Java 库-开源

文件大小:549KB

文件格式:ZIP

更新时间:2024-07-31 13:35:17

开源软件

jsoup 是一个用于处理真实世界 HTML 的 Java 库。 它使用最好的 HTML5 DOM 方法和 CSS 选择器提供了一个非常方便的 API,用于获取 URL 以及提取和操作数据。 jsoup 实现了 WHATWG HTML5 规范,并将 HTML 解析为与现代浏览器相同的 DOM。 jsoup 旨在处理各种常见的 HTML; 从原始和验证,到无效的标签汤; jsoup 将创建一个合理的解析树。 解析器将尽一切努力从您提供的 HTML 创建一个干净的解析,无论 HTML 格式是否正确。 您在 Java 字符串中有 HTML,并且您想解析该 HTML 以获取其内容,或确保其格式正确,或对其进行修改。 字符串可能来自用户输入、文件或网络。


网友评论