前言
在JAVA虚拟机内存管理中,堆、栈、方法区、常量池等概念经常被提到,对理论知识的理解也常常停留在字面意思上,比如说堆内存中存放对象,栈内存中存放局部变量,常量池中存放字符串常量表等,本篇文章通过一个有趣的例子,尽量将这些理论概念通过程序样例及图解的方式表达清楚,让我们更能深入底层知识。
例子
源码
- StringJvm类中定义了一个CONST_STRING字符串常量,并赋值"Hello World";
- main方法定义String类型的str1,str2变量,两个变量都赋值"Hello World";
- 比较一下str1和str2的地址值是否相等 ;
- new 一个String类型的str3,并通过构造函数初始化值为"Hello World";
- 比较一下str3和str3的地址值是否相等。
/**
* 理解JVM--堆内存中的对象
* @author zhuhuix
* @date 2020-05-19
*
*/
public class StringJvm {
public static final String CONST_STRING="Hello World";
public static void main(String[] args) {
String str1 =CONST_STRING;
String str2 =CONST_STRING;
System.out.println("str1==str2: "+ (str1 == str2));
System.out.println("str1==CONST_STRING: "+ (str1 == CONST_STRING));
String str3 =new String(CONST_STRING);
System.out.println("str3==str1: "+(str3 == str1));
}
}
输出
先说两个比较结果:
- str1的地址值等于str2的地址值
- str1的地址值等于CONST_STRING的地址值
- str3的地址值不等于str1地址值,即也不等于str2值
图解
有些同学有可能会有疑问,明明四个字符串的值都是“Hello World”,地址值却有相等 ,也有不相等的,这里就会引入JVM的堆内存、栈内存,常量池的一些基本概念,我们直接上图再讲解说明:
- 定义静态常量CONST_STRING放入方法区;赋值时,JVM会在字符串常量池中放入"Hello World"字符串供共享使用,并将内存地址赋给静态常量。
- 定义str1变量并给该字符串赋值时,JVM首先会在字符串常量池中寻找字符串值相同的内存地址,并将该内存地址赋值str1变量。所以在程序中打印输出str1变量的地址值是否等 于静态常量CONST_STRING的地址值时,得到的结果是True.
- 定义str2变量时按以上2过程同样处理,也即str2的地址值等于CONST_STRING和str1的地址值。
- 在定义str3变量时,采用了强制new一个对象及构造方法传值方式处理,我们知道new一个对象,一定会在堆中分配内存给该对象,也即str3的地址值引用在堆内存中,所以str3的地址值肯定不等于str1的地址值。
深入分析
以上的图解只是JVM的理论上解释了为什么有些地址值相等,有些地址值不等,接下来我们创建一个获取地址值的工具类,来验证以上的理论知识。
首先我们利用Java中的Unsafe类创建一个工具类及静态方法,模仿C++手动管理内存的能力来获取对象的实际地址值。
/**
* 获取JVM object的内存地址
* @author zhuhuix
* @date 2020-05-19
*
*/
public class ObjectAddress {
private static Unsafe unsafe;
static
{
try
{
Field field = Unsafe.class.getDeclaredField("theUnsafe");
field.setAccessible(true);
unsafe = (Unsafe)field.get(null);
}
catch (Exception e)
{
e.printStackTrace();
}
}
public static long addressOf(Object o) {
Object[] array = new Object[] {o};
long baseOffset = unsafe.arrayBaseOffset(Object[].class);
int addressSize = unsafe.addressSize();
long objectAddress;
switch (addressSize)
{
case 4:
objectAddress = unsafe.getInt(array, baseOffset);
break;
case 8:
objectAddress = unsafe.getLong(array, baseOffset);
break;
default:
throw new Error("unsupported address size: " + addressSize);
}
return(objectAddress);
}
接下来改造一下原来的程序:
/**
* 理解JVM--堆内存中的对象
* @author zhuhuix
* @date 2020-05-19
*
*/
public class StringJvm {
public static final String CONST_STRING="Hello World";
public static void main(String[] args) {
System.out.println( "CONST_STRING的地址值:"+ObjectAddress.addressOf(CONST_STRING));
String str1 =CONST_STRING;
String str2 =CONST_STRING;
System.out.println( "str1的地址值 :"+ObjectAddress.addressOf(str1));
System.out.println("str1==str2: "+ (str1 == str2));
System.out.println("str1==CONST_STRING: "+ (str1 == CONST_STRING));
String str3 =new String(CONST_STRING);
System.out.println("str3的地址值 :"+ ObjectAddress.addressOf(str3));
System.out.println("str3==str1: "+(str3 == str1));
}
}
输出结果如下:
这里我们实际看到了对象的实际地址值,静态常量CONST_STRING的地址值等于str1的地址值;str3的地址值不等于str1的地址值。
学以致用
运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是说,并非预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可以将新的常量放入池中,这种特性被开发人员利用得比较多的便是String类的intern()方法。
我们看下上面这段话,JVM告诉我们常量池有动态的特性,利用String类的intern()方法能够将当前String对象与常量池动态绑定起来。为了更好理解,我们再改造一下例子:
/**
* 理解JVM--堆内存中的对象
* @author zhuhuix
* @date 2020-05-19
*
*/
public class StringJvm {
public static final String CONST_STRING="Hello World";
public static void main(String[] args) {
System.out.println( "CONST_STRING的地址值:"+ObjectAddress.addressOf(CONST_STRING));
String str1 =CONST_STRING;
String str2 =CONST_STRING;
System.out.println( "str1的地址值 :"+ObjectAddress.addressOf(str1));
System.out.println("str1==str2: "+ (str1 == str2));
System.out.println("str1==CONST_STRING: "+ (str1 == CONST_STRING));
String str3 =new String(CONST_STRING);
System.out.println("str3 new String的地址值 :"+ ObjectAddress.addressOf(str3));
System.out.println("str3==str1: "+(str3 == str1));
//通过intern方法在程序运行运程中与常量池进行动态绑定
str3=str3.intern();
System.out.println("str3.intern()的地址值 :"+ ObjectAddress.addressOf(str3));
System.out.println("str3.intern()后==str1: "+(str3 == str1));
}
}
看下输出结果:我们发现利用此方法str3的地址值与str1地址一致了,也就是说str3也指向了常量池中初始的内存分配地址。
把以上改造后的代码,再用这张图说明就一清二楚了。
写在最后
JVM的架构设计是非常精妙的,需要深入底层进行剖析;在对系统架构的学习过程中,结合原理动手写样例代码,画原型图是我们学习路上必不可少的一步。