文件名称:jsoup:jsoup:Java HTML解析器,构建用于HTML编辑,清理,抓取和XSS安全
文件大小:538KB
文件格式:ZIP
更新时间:2024-02-24 10:37:14
css java html parse dom
jsoup:Java HTML解析器 jsoup是一个用于处理实际HTML的Java库。 它使用HTML5最佳DOM方法和CSS选择器,为获取URL以及提取和处理数据提供了非常方便的API。 jsoup实现规范,并将HTML解析为与现代浏览器相同的DOM。 从URL,文件或字符串中抓取并HTML 使用DOM遍历或CSS选择器查找和 处理,属性和文本 根据安全列表用户提交的内容,以防止XSS攻击 输出整洁HTML jsoup旨在处理野外发现的所有各种HTML; 从原始和验证到无效的标签汤; jsoup将创建一个明智的解析树。 有关下载和完整的请参见 。 例 获取主页,将其解析为 ,然后从“新闻中”部分的标题中选择列表: Document doc = Jsoup . connect( " https://en.wikipedia.org/ " ) . get(); log(doc . title()); Elements newsHeadlines = doc . select( " #mp-itn b a " ); for ( Element headline : newsH