原创

Java虚拟机类加载机制与类加载过程

1. 类加载的时机

类从被加载到虚拟机内存中开始,到卸载内存为止,生命周期包括 7 个阶段:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)、卸载(Unloading)。其中验证、准备、解析统称为链接(Linking)。

file

加载、验证、准备、初始化、卸载这 5 个阶段顺序确定,类加载过程必须按照这种顺序,解析阶段则不一定。

2. 类加载过程

类加载过程即上面的:加载、验证、准备、解析、初始化这 5 个过程。

2.1 加载

类加载过程的第一步,主要完成下面3件事情:

  1. 通过全类名获取定义此类的二进制字节流
  2. 将字节流所代表的静态存储结构转换为方法区的运行时数据结构
  3. 在内存中生成一个代表该类的 Class 对象,作为方法区这些数据的访问入口

虚拟机规范多上面这3点并不具体,因此是非常灵活的。比如:"通过全类名获取定义此类的二进制字节流" 并没有指明具体从哪里获取、怎样获取。比如:

  • 从 ZIP 包中读取(日后出现的JAR、EAR、WAR格式的基础)
  • 从网络中获取,典型场景为Applet
  • 运行时计算生成,使用的场景最多的就是动态代理
  • 由其他文件生成,典型场景为JSP,由JSP文件生成对应的 Class 类

一个非数组类的加载阶段(加载阶段获取类的二进制字节流的动作)是可控性最强的阶段,这一步我们可以去完成还可以自定义类加载器去控制字节流的获取方式(重写一个类加载器的 loadClass() 方法)。数组类型不通过类加载器创建,它由 Java 虚拟机直接创建。

类加载器、双亲委派模型也是非常重要的知识点。Java中ClassLoader详解

加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中,方法区中存储格式虚拟机实现自己定义,然后在内存中实例话一个 java.lang.Class 类的对象,这个对象将作为程序访问方法区中的这些类型数据的外部接口。注意:java.lang.Class 类的对象比较特殊,虽然他是对象,但是HotSpot存在方法区里,规范并没有规定它一定要在堆中。

加载阶段和连接阶段的部分内容是交叉进行的,加载阶段尚未结束,连接阶段可能就已经开始了。

2.2 验证

Class 文件并不要求是 Java 源码编译而来,可以任何途径产生,甚至可以16进制编辑器直接编写,所以验证非常重要。主要有 4 个验证:文件格式验证、元数据验证、字节码验证、符号引用验证。

2.2.1 文件格式验证

第一阶段主要验证字节流是否符合 Class 文件规范并能否被当前虚拟机处理。源码hotspot/src/share//vm/classfile/classFileParser.cpp中,如包括以下:

  • 是否以魔数0xCAFEBABE开头。
  • 主、次版本号是否在当前虚拟机处理范围之内。
  • 常量池的常量中是否有不被支持的常量类型(检查常量的 tag 标志)。
  • 指向常量的各种索引值是否有指向不存在的常量或者不符合类型的常量。
    .......

2.2.2 元数据验证

第二阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合 Java 语言规范(Java语法)的要求。如包括以下:

  • 这个类是否有父类(出了 java.lang.Objeact 都有父类)。
  • 这个类的父类是否继承了不被允许的类(被final修饰)。、
  • 如果不是抽象类是否实现了父类或接口的方法。
  • 类中字段、方法是否与父类产生矛盾(覆盖了final字段、重载错误、重写错误等)。
    ......

2.2.3 字节码验证

第三阶段是要是通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。第二阶段对元数据信息中的数据类型做完校验后,这个阶段对类的方法进行校验分析,保证不会执行对虚拟机有危险的代码。如包括以下:

  • 保证任意时刻操作数栈的数据类型类与指令代码序列都能配合工作(如操作栈int,使用时按long类型加载入本地变量表)。
  • 保证跳转指令不会跳转到方法体意外的字节码指令上。
  • 保证方法体中的类型转换是有效的。
    ......

2.2.4 符号引用验证

最后一个阶段的校验发生在虚拟机将符号引用转化为直接引用的时侯,这个转发动作将在连接的第三阶段解析中发生。符号引用验证可以看作是对类自身以外(常量池汇总的各种符号引用)的信息进行匹配性校验,通常需要校验如下内容:

  • 符号引用中通过字符串描述的全限定名是否能找到对应的类。
  • 在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段。
  • 符号引用中的类、字段、方法的访问性(public、private。。。)是否可被当前类访问。
    ......

2.3 准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。对于该阶段有以下几点需要注意:

  1. 这时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在 Java 堆中。
  2. 这里所设置的初始值"通常情况"下是数据类型默认的零值(如0、0L、null、false等),比如我们定义了public static int value=111 ,那么 value 变量在准备阶段的初始值就是 0 而不是111(初始化阶段才会复制)。特殊情况:比如给 value 变量加上了 fianl 关键字public static final int value=111 ,那么准备阶段 value 的值就被复制为 111。

基本数据类型的零值:
file

2.4 解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7类符号引用进行。

符号引用就是一组符号来描述目标,可以是任何字面量,只要使用时无歧义定位到目标即可。
直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

在程序实际运行时,只有符号引用是不够的,举个例子:在程序执行方法时,系统需要明确知道这个方法所在的位置。Java 虚拟机为每个类都准备了一张方法表来存放类中所有的方法。当需要调用一个类的方法的时候,只要知道这个方法在方发表中的偏移量就可以直接调用该方法了。通过解析操作符号引用就可以直接转变为目标方法在类中方法表的位置,从而使得方法可以被调用。

综上,解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,也就是得到类或者字段、方法在内存中的指针或者偏移量。

2.5 初始化

初始化是类加载的最后一步,也是真正执行类中定义的 Java 程序代码(字节码),初始化阶段是执行类构造器 <clinit> ()方法的过程

对于<clinit>() 方法的调用,虚拟机会自己确保其在多线程环境中的安全性。因为 <clinit>() 方法是带锁线程安全,所以在多线程环境下进行类初始化的话可能会引起死锁,并且这种死锁很难被发现。

对于初始化阶段,虚拟机严格规范了有且只有5种情况下,必须对类进行初始化:

  1. 当遇到 new 、 getstatic、putstatic或invokestatic 这4条直接码指令时,比如 new 一个类,读取一个静态字段(未被 final 修饰)、或调用一个类的静态方法时。
  2. 使用 java.lang.reflect 包的方法对类进行反射调用时 ,如果类没初始化,需要触发其初始化。
  3. 初始化一个类,如果其父类还未初始化,则先触发该父类的初始化。
  4. 当虚拟机启动时,用户需要定义一个要执行的主类 (包含 main 方法的那个类),虚拟机会先初始化这个类。
  5. 当使用 JDK1.7 的动态动态语言时,如果一个 MethodHandle 实例的最后解析结构为 REF_getStatic、REF_putStatic、REF_invokeStatic、的方法句柄,并且这个句柄没有初始化,则需要先触发器初始化。

3. 类卸载

类即该类的Class对象被GC。

卸载类需要满足3个要求:

  1. 该类所有的实例都已经被回收,也就是 Java 堆中不存在该类的任何实例。
  2. 加载该类的 ClassLoader 已经被回收。
  3. 该类对应的 java.lang.Class 对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

所以,在JVM生命周期类,由jvm自带的类加载器加载的类是不会被卸载的。但是由我们自定义的类加载器加载的类是可能被卸载的。

只要想通一点就好了,jdk自带的BootstrapClassLoader,ExtClassLoader,AppClassLoader负责加载jdk提供的类,所以它们(类加载器的实例)肯定不会被回收。而我们自定义的类加载器的实例是可以被回收的,所以使用我们自定义加载器加载的类是可以被卸载掉的。

正文到此结束
本文目录