总结:字符串优化
由于String对象时不可变对象,因此在需要对字符串进行修改操作时(如字符串连接和替换),String对象总是会生成新的对象,所以其性能相对较差。
String常量的累加操作:对于静态字符串的连接操作,Java在编译时会进行彻底的优化,将多个连接操作的字符串在编译时合成一个单独的长字符串。
String变量的累加操作:底层使用了StringBuilder的功能。
StringBuffer和StringBuilder的扩容策略:当字符串缓冲区容量不足时,原有容量将会加倍,以新的容量来申请内存空间,建立新的char数组,然后将原数组中的内容复制到这个新的数组当中。因此,对于大对象的扩容会涉及大量的内存复制操作。所以,如果能够预先评估StringBuilder或StringBuffer的大小,将能够有效的节省这些操作,从而提高系统的性能。
JAVA的字符串拼接与性能
在JAVA中拼接两个字符串的最简便的方式就是使用操作符”+”了。如果你用”+”来连接固定长度的字符串,可能性能上会稍受影响,但是如果你是在循环中来”+”多个串的话,性能将指数倍的下降。假设有一个字符串,我们将对这个字符串做大量循环拼接操作,使用”+”的话将得到最低的性能。但是究竟这个性能有多差?
如果我们同时也把StringBuffer,StringBuilder或String.concat()放入性能测试中,结果又会如何呢?本文将会就这些问题给出一个答案!
我们将使用Per4j来计算性能,因为这个工具可以给我们一个完整的性能指标集合,比如最小,最大耗时,统计时间段的标准偏差等。在测试代码中,为了得到一个准确的标准偏差值,我们将执行20个拼接”*”50,000次的测试。下面是我们将使用到的拼接字符串的方法:
Concatenation Operator (+)
String concat method – concat(String str)
StringBuffer append method – append(String str)
StringBuilder append method – append(String str)
最后,我们将看看字节码,来研究这些方法到底是如何执行的。现在,让我们先开始来创建我扪的类。注意为了计算每个循环的性能,代码中的每段测试代码都需要用Per4J库进行封装。首先我们先定义迭代次数
1 private static final int OUTER_ITERATION=20;
2 private static final int INNER_ITERATION=50000;
接下来,我们将使用上述4个方法来实现我们的测试代码。
01 String addTestStr = "";
02 String concatTestStr = "";
03 StringBuffer concatTestSb = null;
04 StringBuilder concatTestSbu = null;
05 for (intouterIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
06 StopWatch stopWatch = newLoggingStopWatch("StringAddConcat");
07 addTestStr = "";
08 for (intinnerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
09 addTestStr += "*";
10 stopWatch.stop();
11 }
12 for (intouterIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
13 StopWatch stopWatch = newLoggingStopWatch("StringConcat");
14 concatTestStr = "";
15 for (intinnerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
16 concatTestStr.concat("*");
17 stopWatch.stop();
18 }
19 for (intouterIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
20 StopWatch stopWatch = newLoggingStopWatch("StringBufferConcat");
21 concatTestSb = new StringBuffer();
22 for (intinnerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
23 concatTestSb.append("*");
24 stopWatch.stop();
25 }
26 for (intouterIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
27 StopWatch stopWatch = newLoggingStopWatch("StringBuilderConcat");
28 concatTestSbu = new StringBuilder();
29 for (intinnerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
30 concatTestSbu.append("*");
31 stopWatch.stop();
32 }
接下来通过运行程序来生成性能指标。我的运行环境是64位的Windown7操作系统,32位的JVM(7-ea)带4GB内存,双核Quad 2.00GHz的CPU的机器.
经过20次迭代后,我们得到如下的数据:
结果非常完美如我们想象的那样。唯一比较有趣的事情是为什么String.concat也很不错,我们都知道,String是一个常类(初始化后就不会改变的类),那么为什么concat的性能会更好一些呢。(译者注:其实原文作者的测试代码有问题,对于concat()方法的测试代码应该写成concatTestStr=concatTestStr.concat(“*”)才对。)为了回答这个问题,我们应该看看concat反编译出来的字节码。在本文的下载包里面包含了所有的字节码,但是现在我们先看一下concat的这个代码片段:
01 46: new #6; //class java/lang/StringBuilder
02 49: dup
03 50: invokespecial #7; //Methodjava/lang/StringBuilder."":()V
04 53: aload_1
05 54: invokevirtual #8; //Methodjava/lang/StringBuilder.append:
06 (Ljava/lang/String;)Ljava/lang/StringBuilder;
07 57: ldc #9; //String *
08 59: invokevirtual #8; //Methodjava/lang/StringBuilder.append:
09 (Ljava/lang/String;)Ljava/lang/StringBuilder;
10 62: invokevirtual #10; //Methodjava/lang/StringBuilder.toString:()
11 Ljava/lang/String;
12 65: astore_1
13 66: iinc 7, 1
14 69: goto 38
这段代码是String.concat()的字节码,从这段代码中,我们可以清楚的看到,concat()方法使用了StringBuilder,concat()的性能应该和StringBuilder的一样好,但是由于额外的创建StringBuilder和做.append(str).append(str).toString()的操作,使得concate的性能会受到一些影响,所以StringBuilder和StringCancate的时间是1.8和3.3。
因此,即时在做最简单的拼接时,如果我们不想创建StringBuffer或StringBuilder实例使,我们也因该使用concat。但是对于大量的字符串拼接操作,我们就不应该使用concat(译者注:因为测试代码功能上并不完全等价,更换后的测试代码concat的平均处理时间是1650.9毫秒。这个结果在原文的评论里面。),因为concat会降低你程序的性能,消耗你的cpu。因此,在不考虑线程安全和同步的情况下,为了获得最高的性能,我们应尽量使用StringBuilder
转自:http://blog.csdn.net/kimsoft/article/details/3353849
- import java.util.ArrayList;
- import java.util.List;
- import org.apache.commons.lang.StringUtils;
- import org.junit.Test;
- import org.slf4j.Logger;
- import org.slf4j.LoggerFactory;
- public class TestString {
- private final Logger logger = LoggerFactory.getLogger(this.getClass());
- @Test
- public void testPlus() {
- String s = "";
- long ts = System.currentTimeMillis();
- for (int i = 0; i < 10000; i++) {
- s = s + String.valueOf(i);
- }
- long te = System.currentTimeMillis();
- logger.info("+ cost {} ms", te - ts);
- }
- @Test
- public void testConcat() {
- String s = "";
- long ts = System.currentTimeMillis();
- for (int i = 0; i < 10000; i++) {
- s = s.concat(String.valueOf(i));
- }
- long te = System.currentTimeMillis();
- logger.info("concat cost {} ms", te - ts);
- }
- @Test
- public void testJoin() {
- List<String> list = new ArrayList<String>();
- long ts = System.currentTimeMillis();
- for (int i = 0; i < 10000; i++) {
- list.add(String.valueOf(i));
- }
- StringUtils.join(list, "");
- long te = System.currentTimeMillis();
- logger.info("StringUtils.join cost {} ms", te - ts);
- }
- @Test
- public void testStringBuffer() {
- StringBuffer sb = new StringBuffer();
- long ts = System.currentTimeMillis();
- for (int i = 0; i < 10000; i++) {
- sb.append(String.valueOf(i));
- }
- sb.toString();
- long te = System.currentTimeMillis();
- logger.info("StringBuffer cost {} ms", te - ts);
- }
- @Test
- public void testStringBuilder() {
- StringBuilder sb = new StringBuilder();
- long ts = System.currentTimeMillis();
- for (int i = 0; i < 100000; i++) {
- sb.append(String.valueOf(i));
- }
- sb.toString();
- long te = System.currentTimeMillis();
- logger.info("StringBuilder cost {} ms", te - ts);
- }
- }
运行结果如下:
11:00:22,359 INFO TestString:23 - + cost 1828 ms
11:00:22,921 INFO TestString:34 - concat cost 562 ms
11:00:22,937 INFO TestString:46 - StringUtils.join cost 16 ms
11:00:22,968 INFO TestString:58 - StringBuffer cost 31 ms
11:00:23,031 INFO TestString:70 - StringBuilder cost 63 ms
要特别注意的是:
StringBuilder 循环的次数是其它的10倍,如果是一样,那么返回 0,可见StringBuilder 的速度之快。
总结:
用+的方式效率最差,concat由于是内部机制实现,比+的方式好了不少。
Join 和 StringBuffer,相差不大,Join方式要快些,可见这种JavaScript中快速拼接字符串的方式在Java中也非常适用。
StringBuilder 的速度最快,但其有线程安全的问题,而且只有JDK5支持。