Java基础系列1:深入理解Java数据类型
当初学习计算机的时候,教科书中对程序的定义是:程序=数据结构+算法,Java基础系列第一篇就聊聊Java中的数据类型。
本篇聊Java数据类型主要包括四个内容:
- Java基本类型
- Java封装类型
- 自动装箱和拆箱
- 封装类型缓存机制
Java基本类型
Java基本类型分类、大小及表示范围
Java的基本数据类型总共有8种,包括三类:数值型,字符型,布尔型,其中
- 数值型:
- 整数类型:byte、short、int、long
- 浮点类型:float、double
- 字符型:char
- 布尔型:boolean
字符类型在内存中占有2个字节,可以用来保存英文字母等字符。计算机处理字符类型时,是把这些字符当成不同的整数来看待,即ASKII码,因此,严格来说,字符类型也算是整数类型的一种。
Java的这8种基本类型的大小,即所占用的存储字节数,以及可以表示的数据范围如下表所示:
Java基本类型之间的转换
Java是强类型的编程语言,其数据类型在定义时就已经确定了,因此不能随意转换成其他的数据类型,但是Java允许将一种类型赋值给另一种类型。
在Java中,boolean类型与其他7种类型的数据都不能进行转换,这一点很明确。
但对于其他7种数据类型,它们之间都可以进行转换,只是可能会存在精度损失或其他一些变化。转换分为自动转换和强制转换:
- 自动类型转换(隐式):无需任何操作
- 强制类型转换(显式):需使用转换操作符
自动类型转换需要满足如下两个条件:
- 转换前的数据类型与转换后的数据类型兼容;
- 转换后的数据类型的表示范围比转换前的类型大。
如果将6种数值类型作如下排序:
1 |
double > float > long > int > short > byte |
那么从小转换到大,那么可以直接转换,而从大到小,或char或其他6种数据类型转换,则必须使用强制转换,且可能会发生精度损失。
Java基本数据类型的默认值
在某些场景下,比如在Restful API接口中,如果在dto中使用了基本类型的参数,那么即使请求体中没有传该参数,服务器在做反序列化的时候也会将该参数以默认值来处理。所以在实际开发的dto中务必不要使用基本类型。
以下是Java基本数据类型的默认值:
Java封装类型
对于上面的8种基本类型,Java都有对应的封装类型:
基本类型 | 封装类型 |
---|---|
byte | Byte |
int | Integer |
short | Short |
float | Float |
double | Double |
long | Long |
boolean | Boolean |
char | Character |
基本类型 vs 封装类型
Java封装类型与基本类型相比,有如下区别:
- 从参数传递上来说,基本类型只能按值传递,而每个封装类都是按引用传递的;
- 从存储的位置上来说,基本类型是存储在栈中的,而所有的对象都是在堆上创建和存储的,所以基本类型的存取速度要快于在堆中的封装类型的实例对象;JDK5.0开始可以自动封包了 ,也就是基本数据可以自动封装成封装类,基本数据类型的好处就是速度快(不涉及到对象的构造和回收),封装类的目的主要是更好的处理数据之间的转换,方法很多,用起来也方便。
- 基本类型的优势是:数据存储相对简单,运算效率比较高;
- 封装类型的优势是:类型转换的api更好用了,比如Integer.parseInt(*)等的,每个封装类型都提供了parseXXX方法和toString方法。而且在集合当中,也只能使用封装类型。封装类型满足了Java中一切皆对象的原则。
自动装箱和拆箱
什么是自动装箱和拆箱
1 |
// 自动装箱 |
简单地说,装箱就是自动将基本数据类型转换为封装类型;拆箱就是自动将封装类型转换为基本类型。
自动装箱和拆箱的执行过程
我们就以上面的Integer的简单例子来研究执行过程,具体代码如下:
1 |
public class Main { |
先编译,执行:javac Main.java
,
再反编译,执行:javap -c Main
,
执行后得到如下内容:
可以看到,
在执行Integer numInteger = 66;
的时候,系统为我们执行了Integer numInteger = Integer.valueOf(66)
;
在执行int numInt = numInteger;
的时候,系统为我们执行了int numInt = numInteger.intValue();
我们再来看一下Integer中valueOf方法的源码:
1 |
public static Integer valueOf(int i) { |
其中IntegerCache.low=-128,IntegerCache.high=127。
也即,在执行Integer.valueOf(num)方法时,会先判断num的大小,如果小于-128或者大于127,就创建一个Integer对象,否则就从IntegerCache中来获取。这里涉及到了Integer的缓存机制,下一小节详细讨论。
1 |
private final int value; public Integer(int value) { |
这是Integer的构造函数,里面定义了一个value变量,创建一个Integer对象,就会给这个变量初始化。
再来简单看看IntegerCache是什么东西,IntegerCache类时Integer类的一个内部类,其包含了三个属性,如下:
1 |
private static class IntegerCache { |
在valueOf方法中用到的cache数组,是一个静态的Integer数组对象,而这个数组对象在Integer第一次使用的时候就会创建好。
总之,valueOf返回的都是一个Integer对象。所以我们这里可以总结一点:装箱的过程会创建对应的对象,这个会消耗内存,所以装箱的过程会增加内存的消耗,影响性能。
封装类型缓存机制
Integer缓存机制源码分析
我们仍旧以Integer的例子来说明封装类型的缓存机制,看一下完整的IntegerCache类的代码:
1 |
private static class IntegerCache { |
代码很简单,JVM在初始化的时候可以配置值java.lang.Integer.IntegerCache.high
,默认为127,然后在第一次使用Integer的时候,不是只创建需要的那一个Integer对象,而是创建值在-128到java.lang.Integer.IntegerCache.high
范围内的所有的Integer对象,然后将其放入到cache数组中。
然后在每次自动装箱的时候,如果值落在该范围内,则自动从cache数组中去拿出已经实例化的对象来用,而不用再次去实例化这样一个Integer对象。
每一个整数类型和字符类型、bool类型的封装类型都有类似的缓存机制,这也是为了减轻封装类型相比于基本类型的性能消耗。
Integer缓存机制实例
我们再举一个例子来说明缓存机制。
1 |
public class Main { |
后面的执行结果大家可能会很吃惊,原因是什么呢,结合Integer缓存机制的说明,可以明白这个过程如下:
- i1和i2会进行自动装箱,执行了valueOf方法,它们的值落在[-128,128),所以它们取到的IntegerCache.cache中的是同一个对象,所以它们是相等的;
- i3和i4也会进行自动装箱,执行valueOf方法时,它们的值都大于128,所以会执行new Integer(200),也即它们分别创建了两个不同的对象,所以它们肯定不相等。
浮点类型无缓存机制
上面介绍的缓存机制仅针对整数类型、字符类型、布尔类型,因为这几种数据类型在一定区间的值的数量是固定,但是浮点类型如Float和Double却在任意区间都有无数个值。
来看看Double.valueOf的源码就知道了:
1 |
public static Double valueOf(String s) throws NumberFormatException { |
可以看到Double.valueOf是直接返回一个新的Double对象,并没有缓存机制。
使用缓存机制的封装类型
进行一个归类,使用了缓存机制的封装类型有这样几种:
类型 | 默认缓存对象范围 |
---|---|
Integer | [-128,127] |
Short | [-128,127] |
Long | [-128,127) |
Character | [0,127] |
总结
- 当一个基本数据类型与封装类型进行==、+、-、*、/运算时,会将封装类进行拆箱,对基本数据类型进行运算;
- 拆箱完成运算之后,如果返回的结果需要是封装类型,则需要进行自动装箱,返回封装对象;
- equals(Object o) 因为原equals方法中的参数类型是封装类型,所传入的参数类型(a)是原始数据类型,所以会自动对其装箱,反之,会对其进行拆箱;
- 当两种不同类型用==比较时,包装器类的需要拆箱, 当同种类型用==比较时,会自动拆箱或者装箱。