如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
/**
* 得到网页中图片的地址
* @param sets html字符串
*/
public Set< String > getImgStr(String htmlStr) {
Set< String > pics = new HashSet< String >();
String img = "";
Pattern p_image;
Matcher m_image;
String regEx_img = "< img. *src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到< img />数据
img = m_image.group();
// 匹配< img >中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
while (m.find()) {
pics.add(m.group(1));
}
}
return pics;
}
|
以上这篇Java 获取Html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/xyajia/article/details/77648413