使用StringTokenizer分解字符串

时间:2022-07-11 22:15:51

Java分割字符串,一般使用substring、split、StringTokenizer来处理,前两种是String对象的方法,使用字符串可以直接处理,本文介绍下StringTokenizer的使用。
StringTokenizer 的实例化使用new的方式。
构造方法最多有3个参数:

StringTokenizer(String str, String delim, boolean returnDelims)

第一个参数为我们要处理的字符串。
第二个参数为我们分割字符串的分割标记字符。delim的默认值为” \t\n\r\f”(前面有一个空格,不包括双引号)
第三个参数意思是,是否包含分割标记字符本身。默认值为false。

StringTokenizer 中的方法hasMoreElements()和hasMoreElements()的用法是一样的,只是StringTokenizer为了实现Enumeration接口而实现的方法。
StringTokenizer 中的方法nextElements()和nextToken()的用法是一样的,返回StringTokenizer的下一个标记。

下面给出一个实例:

    public static void main(String[] args) {
StringBuffer str = new StringBuffer();
String s = "|struts.xml,1451210087873.xml,.xml,#OA数据库脚本.txt,1451210087857.txt,.txt,";
// for (int i = 0; i < 500000; i++) {
str.append(s);
// }

String temp = null;
long begin = System.currentTimeMillis();

StringTokenizer token = new StringTokenizer(str.toString(),"|#");
while(token.hasMoreTokens()){
temp = token.nextToken();
StringTokenizer token1 = new StringTokenizer(temp,",");
if(token1.hasMoreTokens()){// 只取第一个即可
System.out.println(token1.nextToken());
}
}
System.out.println("耗时:" + (System.currentTimeMillis() - begin));// 9460
}

本例为了输出文件名,直接使用了“|”和“#” 都支持的效果。
相比String的substring和split来说,StringTokenizer更好。
小数据量方面体现不出什么,如果是大数据操作,StringTokenizer 的性能理论上是优与其他两种的。