Java中的字符串操作(比较String,StringBuiler和StringBuffer)

时间:2021-07-07 05:32:52

一、前言

刚开始学习Java时,作为只会C语言的小白,就为其中的字符串操作而感到震撼。相比之下,C语言在字节数组中保存一个结尾的\0去表示字符串,想实现字符串拼接,还需要调用strcpy库函数或者自己手动去复制数组,非常麻烦,更别提其他复杂操作,而Java通过String类让字符串操作变得十分简单和方便。除此之外,还有stringbuilder等这些类的辅助,那么本文就从String,StringBuiler和StringBuffer的区别开始,去探讨Java中的字符串操作。

二、String,StringBuiler和StringBuffer

2.1 String类

Java 提供了 String 类来创建和操作字符串。在源码中可以看到,String类内部的实现也是一个字节数组,这个数组是final类型的,因此String是不可变的对象,每次在对String类进行改变的时候都会生成一个新的string对象,然后将指针指向新的string对象。

2.2 StringBuiler 类

和 String 类不同的是,StringBuilder 类的对象能够被多次的修改,并且不产生新的对象。这个特性的意义在于,如果我们进行大量的字符串操作,使用String类就会产生很大的性能消耗,而StringBuilder就可以避免这个问题。

2.3 StringBuffer 类

StringBuffer 和StringBuiler之间的最大不同在于 StringBuilder 的方法不是线程安全的

由于 StringBuilder 相较于 StringBuffer 有速度优势,所以多数情况下建议使用 StringBuilder 类。然而在应用程序要求线程安全的情况下,则必须使用 StringBuffer 类。

2.4 String,StringBuiler和StringBuffer的比较(对比C/C++)

操作类型 说明 是否可变 线程安全性 性能
Java中的String String 类中使用 final
关键字修饰字符数组来保存字符串
不可变 线程安全
Java中的StringBuffer 字符串变量 可变 线程安全 一般
Java中的StringBuilder 字符串变量 可变 线程不安全 一般
C/C++ 中的char* 操作 char *是一个指针,可以
指向一个字符串数组
可变 不可知
C/C++中的char数组 用一个字符数组来保存字符串 不可变 不可知
C/C++中的String封装类 string可以被看成是以字符
为元素的一种容器。
可变 并发读操作
是线程安全的
较高

三、各种字符串操作的效率测试

3.1 测试代码

    @Test
public void test() {
int count = 100000; long startTime = System.currentTimeMillis();
String str = "";
for(int i = 0; i< count; i++){
str += i;
}
System.out.println("执行"+count+"次 String 耗时:"+ getRunTime(startTime)); startTime = System.currentTimeMillis();
StringBuilder stringBuilder = new StringBuilder("");
for (int i = 0; i < count; i++) {
stringBuilder.append(i);
}
System.out.println("执行"+count+"次 StringBuilder 耗时:"+ getRunTime(startTime)); startTime = System.currentTimeMillis();
StringBuffer stringBuffer = new StringBuffer("");
for (int i = 0; i < count; i++) {
stringBuffer.append(i);
}
System.out.println("执行"+count+"次 StringBuffer 耗时:"+ getRunTime(startTime)); }

3.2 测试结果

执行100000次  String 耗时:32s
执行100000次 StringBuilder 耗时:2ms
执行100000次 StringBuffer 耗时:4ms

3.3 小结

可以看到String类的性能远低于StringBuiler和StringBuffer,而StringBuiler在本次测试中比Stringbuffer提高了50%的性能

四、Java字符串和正则表达式

4.1 测试代码

    @Test
public void test0(){
//邮政编码
String postCode = "[1-9]\\d{5}";
//区号-座机号码
String areaCode = "\\d{3}-\\d{8}|\\d{4}-\\d{7}";
//手机号码
String phone = "(?:13\\d|15\\d|18\\d)\\d{5}(\\d{3}|\\*{3})"; String text = "邮政编码:440834"+
"区号-座机号码: 020-12345678"+
"手机号:13536373839"+
"邮政编码:440833"+
"区号-座机号码: 010-12345678"+
"手机号:13536373739"; Pattern p = Pattern.compile(postCode);
Matcher m = p.matcher(text);
System.out.println("文本中包含邮政编码:");
while (m.find()){
System.out.println(m.group());
} p = Pattern.compile(areaCode);
m= p.matcher(text);
System.out.println("文本中包含区号-座机号码:");
while (m.find()){
System.out.println(m.group());
} p = Pattern.compile(phone);
m= p.matcher(text);
System.out.println("文本中包含手机号:");
while (m.find()){
System.out.println(m.group());
}
}

4.2 测试结果

文本中包含邮政编码:
440834
123456
135363
440833
123456
135363
文本中包含区号-座机号码:
020-12345678
010-12345678
文本中包含手机号:
13536373839
13536373739

五、总结

经过测试和比较,可以看到Java中同为字符串操作,但由于背后实现的原理不同,形成的性能差异也是十分巨大,相比之下,C/C++中的字符串操作性能更高。String类的性能远低于StringBuiler和StringBuffer,而StringBuiler比Stringbuffer的性能稍微高一点。对性能的探究,最终还是要回到使用场景,可以总结得出,如果不涉及字符串操作,那么String类是首选,如果涉及的字符串操作没有线程安全问题,那么使用StringBuilder,如果涉及的字符串操作存在线程安全问题,那么使用StringBuffer

六、参考资料