Xml文件解析工具 - java
解析Xml文件:就是把Xml文件里面的内容取出来。
Xml文件解析工具:一个能解析Xml文件的类,即一个能把Xml文件里面的内容取出来的类。
先给出一个Xml文件(student_infor.xml):
<?xml version="1.0" encoding="UTF-8"?>
<students>
<student id="201810001" name="张三小" sex="男" birth="2000-10-10">
<hobby>足球</hobby>
<hobby>篮球</hobby>
<hobby>混球</hobby>
<hobby>二球</hobby>
<introduce>
张三之子,体格壮硕,胆小如鼠,外号加菲猫!
</introduce>
</student>
<student id="201811001" name="刘诗雅" sex="女" birth="2010-10-21">
<hobby>睡觉</hobby>
<hobby>刷剧</hobby>
<hobby>追星</hobby>
<hobby>打豆豆</hobby>
<introduce>
刘家之女,酷爱唱歌! 但五音有其四,邻居不堪其扰,谓之刘嘶哑!
</introduce>
</student>
</students>
先简单解析一下上面的Xml文件,代码如下:
package com.zss.about_xml_parser.test;
import java.io.IOException;
import java.io.InputStream;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class Test {
public static void main(String[] args) {
try {
DocumentBuilderFactory dbf =
DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
InputStream is = Test.class.getResourceAsStream("/student_infor.xml");
Document document = db.parse(is); //这几行代码就像巫师的咒语,虽然读不懂,但是效果巨大(产生document)
NodeList studentList = document.getElementsByTagName("student");
for(int i = 0; i < studentList.getLength(); i++) {
Element student = (Element) studentList.item(i);
String id = student.getAttribute("id");
String name = student.getAttribute("name");
String sex = student.getAttribute("sex");
String birth = student.getAttribute("birth");
System.out.println("id:" + id);
System.out.println("name:" + name);
System.out.println("sex:" + sex);
System.out.println("birth:[" + birth + "]");
NodeList hobbies = student.getElementsByTagName("hobby");
for(int j = 0; j < hobbies.getLength(); j++) {
Element hobby = (Element) hobbies.item(j);
String hobbyName = hobby.getTextContent();
System.out.println("\t" + hobbyName);
}
Element introduce =(Element) student.getElementsByTagName("introduce").item(0);
System.out.println("简介\n\t" + introduce.getTextContent().trim());
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
结果如下:
id:201810001
name:张三小
sex:男
birth:[2000-10-10]
足球
篮球
混球
二球
简介
张三之子,体格壮硕,胆小如鼠,外号加菲猫!
id:201811001
name:刘诗雅
sex:女
birth:[2010-10-21]
睡觉
刷剧
追星
打豆豆
简介
刘家之女,酷爱唱歌! 但五音有其四,邻居不堪其扰,谓之刘嘶哑!
当然,我们不可能在每次解析Xml文件时,都把上面这段代码敲一遍。我们完全可以写一个Xml文件的解析工具,然后把它打成jar包,以后用的时候导包就行。
注意:上边所有的输出不应是我们工具该有的,工具只负责取出数据,并提供一个操作数据的抽象方法。
工具代码(XMLParser类):
package com.zss.util;
import java.io.IOException;
import java.io.InputStream;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public abstract class XMLParser {
private static final DocumentBuilderFactory dbf;
static { // 静态块 只在该类第一次被引用时执行,以后再不执行
dbf = DocumentBuilderFactory.newInstance(); // 这种方式往往保证dbf是单立的
}
public XMLParser() {
}
public abstract void dealElement(Element element, int index);
public void dealElementInTag(Element element, String tagName) { //此方法用来处理更深入一层的标签
NodeList elements = element.getElementsByTagName(tagName);
for(int index = 0; index < elements.getLength(); index++) {
Element ele = (Element) elements.item(index);
//对于element的处理应该由XMLParser的使用者来决定的!
dealElement(ele, index);
}
}
public void dealElementInTag(Document document, String tagName) { //此方法用来处理最外层标签
NodeList elements = document.getElementsByTagName(tagName);
for(int index = 0; index < elements.getLength(); index++) {
Element element = (Element) elements.item(index);
//对于element的处理应该由XMLParser的使用者来决定的!
dealElement(element, index);
}
}
public static Document getDocument(String xmlPath) {
Document document = null;
try {
DocumentBuilder db = dbf.newDocumentBuilder();
InputStream is = XMLParser.class.getResourceAsStream(xmlPath); //此方法用来得到document
document = db.parse(is);
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return document;
}
}
有了这个工具,该怎么用这个工具去解析Xml文件呢,继续往下看:
package com.zss.about_xml_parser.test; import org.w3c.dom.Element; import com.zss.util.XMLParser; public class Test { public static void main(String[] args) { new XMLParser() { // 匿名内部类嵌套 @Override public void dealElement(Element element, int index) { String name = element.getAttribute("name"); String sex = element.getAttribute("sex"); System.out.println("name:" + name); System.out.println(sex); new XMLParser() { @Override public void dealElement(Element element, int index) { String hobby = element.getTextContent(); System.out.println("\t" + hobby); } }.dealElementInTag(element, "hobby"); //这部分代码请仔细分析!!! } }.dealElementInTag( XMLParser.getDocument("/student_infor.xml"), "student"); } }
结果如下:
name:张三小
男
足球
篮球
混球
二球
name:刘诗雅
女
睡觉
刷剧
追星
打豆豆