1. 字节码指令集简介:
Java虚拟机的指令由一个字节长度的,代表着某种特定操作含义的操作码(Opcode)以及跟随其后的零至多个代表此操作所需参数的操作数(Operands)所构成。虚拟机中许多指令并不包含操作数,只有一个操作码。
如果忽略异常处理,那Java虚拟机的解释器使用下面这个伪代码的循环即可有效地工作:
do { 自动计算PC寄存器以及从PC寄存器的位置取出操作码; if (存在操作数) 取出操作数; 执行操作码所定义的操作 } while (处理下一次循环)
操作数的数量以及长度取决于操作码,如果一个操作数的长度超过了一个字节,那它将会以Big-Endian顺序存储——即高位在前的字节序。举个例子,如果要将一个16位长度的无符号整数使用两个无符号字节存储起来(将它们命名为byte1和byte2),那它们的值应该是这样的:
(byte1 << 8) | byte2
字节码指令流应当都是单字节对齐的,只有“tableswitch”和“lookupswitch”两条指令例外,由于它们的操作数比较特殊,都是以4字节为界划分开的,所以这两条指令那个也需要预留出相应的空位来实现对齐。
2.11.1 数据类型与java虚拟机
2.11.2 加载和存储指令:
加载和存储指令用于将数据从栈帧(2.6)的局部变量表(2.6.1)和操作数栈之间来回传输(2.6.2):
a. 将一个局部变量加载到操作栈的指令:iload, iload_<n>, lload, lload_<n>, fload, fload_<n>, dload, dload_<n>, aload, aload_<n> b. 将一个数值从操作数栈存储到局部变量表的指令:istore, istore_<n>, lstore lstore_<n>, fstore, fstore_<n>, dstore, dstore_<n>, astore, astore_<n> c. 将一个常量加载到操作数栈的指令:bipush, sipush, ldc, ldc_w,l dc2_w, aconst_null, iconst_m1, iconst_<i>, lconst_<l>, fconst_<f>, dconst_<d> d. 扩充局部变量表的访问索引的指令:wide |
上面的指令助记符中,有一部分是以尖括号结尾的(例如iload_<n>),这些指令助记符实际上是代表了一组指令(例如iload_<n>,它代表iload_0、iload_1、iload_2和iload_3这几条指令)。这几组指令都是某个带有一个操作数的通用指令(例如iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都是在指令中隐含的。他们的语义与原生的通用指令完全一致(如iload_0的语义与操作数为0时的iload指令语义一致)。在尖括号之间的字母制定了指令隐含操作数的数据类型,<i>代表是int形数据。
2.11.3 运算指令
算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新存入到操作栈顶。
所有的算术指令包括:
加法指令:iadd、ladd、fadd、dadd
减法指令:isub、lsub、fsub、dsub
乘法指令:imul、lmul、fmul、dmul
除法指令:idiv、ldiv、fdiv、ddiv
求余指令:irem、lrem、frem、drem
取反指令:ineg、lneg、fneg、dneg
位移指令:ishl、ishr、iushr、lshl、lshr、lushr
按位或指令:ior、lor
按位与指令:iand、land
按位异或指令:ixor、lxor
局部变量自增指令:iinc
比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp
注意:
1. Java虚拟机在处理浮点数运算时,不会抛出任何运行时异常,当一个操作产生溢出时,将会使用有符号的无穷大来表示。操作结果没有明确的数学定义的话,将会时候NaN值来表示。
2. 在处理整型数据时,只有除法指令(idiv和ldiv)以及求余指令(irem和lrem)出现除数为零时会导致虚拟机抛出异常
2.11.4 类型转换指令
Java虚拟机直接支持(无需显式转换指令)以下数值的宽化类型转换(小范围类型向大范围类型的安全转换):
a. int类型到long、float或者double类型
b. long类型到float、double类型
c. float类型到double类型
宽化类型转换指令包括:i2l, i2f, i2d, l2f, l2d, f2d
窄化类型转换:指令包括有:i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l和d2f。窄化类型转换可能会导致转换结果产生不同的正负号、不同的数量级,转换过程很可能会导致数值丢失精度。
在将int或long类型窄化转换为整数类型T的时候,转换过程仅仅是简单的丢弃除最低位N个字节以外的内容,N是类型T的数据类型长度,这将可能导致转换结果与输入值有不同的正负号(译者注:在高位字节符号位被丢弃了)。
在将一个浮点值转窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则:
a. 如果浮点值是NaN,那转换结果就是int或long类型的0
b. 否则,如果浮点值不是无穷大的话,浮点值使用IEEE 754的向零舍入模式(§2.8.1)取整,获得整数值v,这时候可能有两种情况:
b.1 如果T是long类型,并且转换结果在long类型的表示范围之内,那就转换为long类型数值v
b.2 如果T是int类型,并且转换结果在int类型的表示范围之内,那就转换为int类型数值v
c. 否则:
c.1 如果转换结果v的值太小(包括足够小的负数以及负无穷大的情况),无法使用T类型表示的话,那转换结果取int或long类型所能表示的最小数字。
c.2 如果转换结果v的值太大(包括足够大的正数以及正无穷大的情况),无法使用T类型表示的话,那转换结果取int或long类型所能表示的最大数字。
2.11.5 对象创建与操作
虽然类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令
创建类实例的指令:new
创建数组的指令:newarray,anewarray,multianewarray
访问类字段(static字段,或者称为类变量)和实例字段(非static字段,或者成为实例变量)的指令:getfield、putfield、getstatic、putstatic
把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload
将一个操作数栈的值储存到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore
取数组长度的指令:arraylength
检查类实例类型的指令:instanceof、checkcast
2.11.6 操作数栈管理指令
Java虚拟机提供了一些用于直接操作操作数栈的指令,包括:pop、pop2、dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2和swap。
2.11.7 控制转移指令
控制转移指令可以让Java虚拟机有条件或无条件地从指定指令而不是控制转移指令的下一条指令继续执行程序。控制转移指令包括有:
条件分支:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt, if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。
复合条件分支:tableswitch、lookupswitch
无条件分支:goto、goto_w、jsr、jsr_w、ret
在Java虚拟机中有专门的指令集用来处理int和reference类型的条件分支比较操作,为了可以无需明显标识一个实体值是否null,也有专门的指令用来检测null值(2.4)。
boolean类型、byte类型、char类型和short类型的条件分支比较操作,都使用int类型的比较指令来完成,而对于long类型、float类型和double类型的条件分支比较操作,则会先执行相应类型的比较运算指令(2.11.3),运算指令会返回一个整形值到操作数栈中,随后再执行int类型的条件分支比较操作来完成整个分支跳转。由于各种类型的比较最终都会转化为int类型的比较操作,基于int类型比较的这种重要性,Java虚拟机提供了非常丰富的int类型的条件分支指令。
所有int类型的条件分支转移指令进行的都是有符号的比较操作。
2.11.8 方法调用和返回指令
以下四条指令用于方法调用:
invokevirtual指令:调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),这也是Java语言中最常见的方法分派方式。
invokeinterface指令:调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象,找出适合的方法进行调用。
invokespecial指令:调用一些需要特殊处理的实例方法,包括实例初始化方法(2.9)、私有方法和父类方法。
invokestatic指令:调用类方法(static方法)。
而方法返回指令则是根据返回值的类型区分的,包括有ireturn(当返回值是boolean、byte、char、short和int类型时使用)、lreturn、freturn、dreturn和areturn,另外还有一条return指令供声明为void的方法、实例初始化方法、类和接口的类初始化方法使用。
2.11.9 抛出异常
在程序中显式抛出异常的操作会由athrow指令实现,除了这种情况,还有别的异常会在其他Java虚拟机指令检测到异常状况时由虚拟机自动抛出。
2.11.10 同步
Java虚拟机可以支持方法级的同步和方法内部一段指令序列的同步,这两种同步结构都是使用管程(Monitor)来支持的。
a. 方法级的同步是隐式,即无需通过字节码指令来控制的,它实现在方法调用和返回操作(2.11.8)之中。虚拟机可以从方法常量池中的方法表结构(4.6)中的ACC_SYNCHRONIZED访问标志区分一个方法是否同步方法。
b. 同步一段指令集序列通常是由Java语言中的synchronized块来表示的,Java虚拟机的指令集中有monitorenter和monitorexit两条指令来支持synchronized关键字的语义.
c. 结构化锁定是指在方法调用期间每一个管程退出都与前面的管程进入相匹配的情形。因为无法保证所有提交给Java虚拟机执行的代码都满足结构化锁定,所以Java虚拟机允许(但不强制要求)通过以下两条规则来保证结构化锁定成立。假设T代表一条线程,M代表一个管程的话:
1. T在方法执行时持有管程M的次数必须与T在方法完成(包括正常和非正常完成)时释放管程M的次数相等。
2. 找方法调用过程中,任何时刻都不会出现线程T释放管程M的次数比T持有管程M次数多的情况。
参考资料:《Java虚拟机规范(Java SE7)》