JVM-字节码指令

时间:2023-12-05 19:28:38

Java虚拟机字节码指令

  了解了class文件,我觉得就很有必要去了解一下JVM中的字节码指令,那样堆class文件以及JVM运行机制也后很大的帮助.

  Java虚拟机的指令由一个字节长度的,代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表所需参数(称为操作数,Oprands)而构成.由于Java虚拟机采用面向操作数栈而不是寄存器的架构,所以大多参数的指令都不包含操作数,只有一个操作码.

字节码指令的一些特性

  由于限制了Java虚拟机操作码的长度为一个字节(0~255),这意味着指令集的操作码总数不可能超过256条.

  由于class文件格式放弃了编译后的操作数长度对齐,这意味着虚拟机处理那些超过一个字节数据的时候,不得不在运行时从字节中重建出具体数据的结构.如果要将一个16位长度的无符号整数,使用两个无符号字节存储起来(将它们命名为byte1和byte2),那它们的值应该是这样的:(byte<<8)| byte2 .这种操作在某种程度上会导致解释执行字节码的时候会损失一些性能.但这样做的优势也是非常明显的,放弃了操作数长度对齐,就意味着可以省略很多填充和间隔符号:用一个字节来表示操作码,也是为了尽可能获得短小精干的编译代码.

 字节码指令与数据类型

  对于大部分与数据类型相关的字节码指令它们的操作码助记符中都有特殊特的字符来表明专门为哪种数据类型服务:i:代表int,l代表long,s代表short,b代表byte,c代表char,f代表float,d代表double,a代表reference.

  Java虚拟机的指令集对于特定的操作只提供了有限的类型相关指令去支持它,换句话说,指令集将会故意被设计成非完全独立的Java虚拟机规范中把这种特性称为"Not Orthpogoal".即并非每种操作都有对应的指令.有一些单独的指令可以在必要的时候来将一些不支持的类型转换成为可被支持的类型.

 加载和存储指令

  加载和存储指令用于将数据在栈帧中的局部变量和操作数之间来回传输.

  将一个局部变量加载到操作栈:ilaod , ioload<n>,llaod , llaod<n>,float,float<n>,double,double<n>,aload,aload<n>.

  将一个数据从操作数栈存储到局部变量表:istore,istore<n>,lstore,lstore<n>,fstore.fstore<n>,dstore,dstore<n>,astore,asotre<n>.

  将一个常量加载到数据栈:bipush,sipush,ldc,ldc_w,ldc2_w,aconst_null,iconst_ml,iconst_<i>,lconst_<l>,fconst_<f>,dconst_<d>

  扩充局部变量表访问索引的指令:wide

 运算指令

  运算或算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新存入到操作栈顶.

  大体上算术指令可以分为两种:对整型数据进行运算的指令对浮点数据进行运算的指令.无论是哪种算术指令,都使用Java虚拟机的数据类型,由于没有直接支持byte,short,char和boolean类型的算术指令,对于这类数据的运算应使用操作int类型的指令代替.

  加法指令:iadd,ladd,fadd,dadd

  减法指令:isub,lsub,fsub,dsub

  乘法指令:imul,lmul,fmul,dmul

  求余指令:irem,lrem,frem,drem

  求反指令:ineg,lneg,fneg,dneg

  移位指令:ishl.ishr,lshl,lshr,lushr

  按位或指令:ior,lor

  按位与指令:iand,land]

  按位异或指令:ixor,lxor

  局部变量自增指令:iinc

  比较指令:dcmpy,dcmpl,fcmpg,fsmpyl,lcomp

  Java虚拟机要求在进行浮点数运算时,所有的运算结果都必须舍入到适当的精度,非精确的结果必须舍入为可被表示的最接近的精确值.如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的,称为向最近数舍入模式.

  在把浮点数转换为整数时,Java虚拟机使用IEEE754规范中的向零舍入模式,这中模式的舍入结果会导致数字被截断,所有小数部分的有效字节都会被丢弃掉.向零舍入模式将在目标数值类型与该数值类型中选择一个最接近但是不大于原数值的数字来作为最精确的舍入结果.

  Java虚拟机在处理浮点数运算时,不会抛出任何运行时异常,当一个操作产生溢出时,将会使用有符号的无穷大来表示,如果某个操作结果没有明确的数学定义的话,将会使用NaN值来表示,所有使用NaN值作为操作数的算术运算,结果都会返回NaN.

  在对long类型数值进行比较时,虚拟机采用带符号的比较方式,而对浮点数值,进行比较时(dcmpy,dcmpl,fcmpg,fcmpl),虚拟机会采用IEEE754规范所定义的无信号比较(Nonsignaling Conparions)方式.  

类型转换指令

  类型转换指令可以将两种不同的数值类型进行相互转换

  Java直接支持(即转换时无需显示进行转换指令)以下数值类型的宽化类型转化(即范围类型向大范围类型的安全转化):

  1. int  -->long , float , double
  2. long -->float , double
  3. float -->double

  处理窄化类型转换时,必须显示的使用转换指令来完成,这些转换指令包括:i2b , i2c , i2s , l2i , f2c , d2i , d2l , d2f.窄化类型转换可能会导致转换结果产生不同的正负号,不同的数量级的情况,转换可能会导致数值精度丢失.

  将一个浮点型数值窄化为整型类型(int 或long)的时候,将遵循一下转换规则

  • 如果浮点值是NaN,那转换结果就是int或long类型的0.
  • 如果浮点值不是无穷大的话,浮点值使用向零舍入模式取整,获得整数v.如果v在目标类型的表示范围之内,转换结果就是v.
  • 否则,将根据v的符号,转换为一个T所能表示的最大会最小正数.

对象创建与访问指令

  指令:

  • 创建类实例的指令:new
  • 创建数组得到指令:newarray , anewarray , multianewarray
  • 访问类字段(static 字段,或者称为类变量)和实例字段(非static 字段,或者称为实例变量)的指令:getfield , putfield , getstatic , putstatic\
  • 把一个数组元素加载到操作数栈的指令:baload , caload , saload , iaload , laload , faload , daload , aaload
  • 将一个操作数栈的值存储到数组元素中的指令:bastore , castore , sastore , iastore , fastore , dastore , aastore
  • 取数组长度的指令:arraylength
  • 检查类实例类型的指令:instanceof , checkcast

 操作数栈管理指令

  Java虚拟机提供了一些直接操作操作数的指令:

  • 操作数栈的栈顶一个或两个元素出栈:pop , po2
  • 复制栈顶一个或两个元素并将复制值或双份值重新压入栈顶:dup ,dup2,duo_x1,dup_x2,dup2_x2
  • 将栈最顶端的两个数值交换:swap

 控制转移指令

  控制转移指令可以让Java虚拟机有条件的从指定的位置而不是控制转移指令的下一条指令继续执行程序。可以认为控制转移指令就是在有条件或无条件的修改PC寄存器的值。

  控制转移指令:

  • 条件分支:ifeq,iflt,ifne,ifge,ifgt,ifnull,ifnonnull,if_icmpeq,if_icmpne,if_icmplt,if_cmpgt,if_icmpge,if_cmpge,if_icmpeq,if_acmpne
  • 复合条件分支:tableswitch,lookupswitch
  • 无条件分支:goto,goto_w,jsr,jsr_w,ret

方法调用和返回指令

  invokevirtual指令用于调用对象德邦实例方法,根据对象的实体的类型进行分派(虚方法分派),也就是Java语言中最常见的方法分派方式。

  invokeinterface指令用于调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象找出适合的方法进行调用。

  invokespecial指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法,私有方法和父类方法

  involvestatic指令用于调用类的方法(static方法)

  invokedynamic指令用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法

  前面4条调用指令的分派逻辑都固化在Java虚拟机的内部,而invokedynamic指令的分派逻辑是由用户设定的引导方法决定的

异常处理指令 

  在Java虚拟机中处理异常catch语句不是由字节码指令来实现的,而是用异常表来完成的。

  在Java程序中显式抛出异常的操作(throw语句)都是由athrow来实现的,除了用throw语句显式抛出异常的情况之外,Java虚拟机规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出。

 同步指令

  Java虚拟机可以支持方法级的同步和方法内部一段指令序列的同步。这两种同步结构都是使用管理(Monitor)来支持的。

  方法级的同步是隐含的,既无需通过字节码指令来控制,也实现在方法调用和返回操作之中。

  同步一段指令序列通常是由Java语言中的synchronize语句块来表示的,Java虚拟机的指令集中有monitorenter和monitorexit两条指令来支持synchronize关键字的语义,正确实现synchronized关键字需要Java编译器与Java虚拟机两者共同协作支持