模式切换
JVM 架构
类加载器
// todo hayden 2024-12-20:待定
运行时数据区域
Java 虚拟机在执行 Java 程序时,会把它所管理的内存划分为若干个不同的数据区域,根据《Java 虚拟机规范》这些区域包括图示几个部分:
Java 虚拟机运行时数据区
方法区
方法区(Method Area)是各个线程共享的内存区域,用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。
在当时,HotSpot 虚拟机设计团队选择把收集器的分代设计扩展至方法区,使用永久代(Permanent Generation)来实现方法区,这样使得 HotSpot 虚拟机的垃圾收集器可以像管理 Java 堆一样管理方法区,而不必为方法区开发专门的内存管理器。
但是这种设计导致了 Java 应用很容易遇到内存溢出问题,并且有极少数的方法(如 String::intern())会因永久代的原因导致不同虚拟机下有不同的表现。
因此,在 JDK 6 的时候 HotSpot 开发团队准备放弃永久代,逐步改用本地内存(Native Memory)来实现方法区。
到了 JDK 7,已经把原本放在永久代的字符串常量池、静态变量等移到堆中。
在 JDK 8,完全废弃永久代,改用与 JRockit、J9 一样在本地内存中实现的元空间(Meta-space)来代替,将 JDK 7 中剩余的(主要是)类型信息全部移到元空间。
拓展知识
字符串常量池
字符串常量池是 JVM 中一块特殊的内存区域,用来存储字符串字面量。当使用双引号定义一个字符串时,JVM 会先检查字符串常量池中有没有这个字面量。如果有,就直接返回它的引用;如果没有,就在常量池里新建一个字符串对象,然后返回它的引用。这样设计主要是为了节省内存空间,提高性能。
静态变量
静态变量是属于类,不是属于某个对象。无论创建多少个类的实例,静态变量都只有一份,被所有实例共享。静态变量可以用类名直接访问,也可以用实例名访问。
运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。字节码文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项就是常量池表(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
一般来说,运行时常量池除了保存字节码文件中描述的符号引用外,还会把由符号引用翻译出来的直接引用也存储在运行时常量池中。
字面量
字面量是指直接使用的常量值(即代码中直接写出来的值),如整数、浮点数、字符串等。字面量是程序中直接出现的常量值,不需要计算。它们在编译时被直接嵌入到生成的字节码里。
例如:
- 整数字面量:
int a = 1;
中的1
就是字面量。 - 浮点数字面量:
float b = 1.0f;
中的1.0f
就是字面量。
符号引用
符号引用用来表示类、接口、字段、方法等的一种抽象方式。在编译时,编译器会将源代码中的类名、方法名等转换为符号引用。然后在运行时,JVM 解析这些引用,找到实际对应的类或方法。
例如:
- 类符号引用:
System.out.println();
中的System
就是类符号引用。 - 方法符号引用:
String str = "hello"; str.length
中的length
就是方法符号引用。
堆
Java 堆(Java Heap)是虚拟机所管理的内存区域中最大的一块,是哥哥线程共享的内存区域。Java 中“几乎”所有对象实例都在这里分配内存。由于即时编译技术的进步,尤其是逃逸分析技术的日渐强大,栈上分配、标量替换优化手段导致了 Java 对象实例不一定都在堆上分配内存。
Java 堆是垃圾收集器管理的内存区域。从回收内存的角度看,现代垃圾收集器大部分基于“分代收集”理论设计,所以 Java 堆中经常出现“新生代”“老年代”“永久代”“Eden 空间”“From Survivor 空间”“To Survivor 空间”等名词。
但是到了今天,垃圾收集器技术已不可同日而语,HotSpot 中也出现了不采用分代设计的新垃圾收集器。如果从分配内存的角度看,所有线程共享的 Java 堆中可以划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB),以提升对象分配时的效率,避免多线程同时分配内存时的竞争。
不论从什么角度,无论如何划分,将 Java 堆细分目的是为了更好地回收内存,或者更快地分配内存。
根据《Java 虚拟机规范》中的规定,Java 堆可以处于物理上不连续的内存空间中,但在逻辑上应该是连续的。
虚拟机栈
Java 虚拟机栈(Java Virtual Machine Stack)是线程私有的内存区域,每个线程创建时都会创建一个虚拟机栈。虚拟机栈的生命周期与线程相同。
虚拟机栈描述的是 Java 方法执行的线程内存模型:每个方法被执行时,虚拟机栈就会同步创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中的入栈和出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference 类型,它不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和 returnAddress 类型(指向了一条字节码指令的地址)。
这些数据类型在局部变量表中的存储空间以局部变量槽(Slot)来表示,其中 32 位以内的数据类型占用一个局部变量槽,64 位的数据类型(long、double)占用两个局部变量槽。
局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在栈帧中分配多大的局部变量表是完全确定的,而且在方法运行期间不会改变局部变量表的大小。需要注意的是这里所说的“大小”指的是变量槽的数量,虚拟机真正使用多大的内存空间(譬如按照 1 个变量槽占用 32 位、64 位,或者更多)来实现变量槽,这完全是由虚拟机决定的。
本地方法栈
本地方法栈(Native Method Stacks)与虚拟机栈类似,只不过虚拟机栈为虚拟机执行 Java 方法服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。
程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。
在 Java 虚拟机概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选择吓一跳需要执行的字节码指令。
程序计数器是程序控制器的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于 Java 虚拟机的多线程是通过线程轮流切换、分配处理器执行时间的形式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每个线程都需要一个独立的程序计数器,各个线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是 Java 方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是 Native 方法,这个计数器值为空(Undefined)。
执行引擎
执行引擎是 Java 虚拟机最核心的组成部分之一,其主要作用是将 Java 源代码编译后的字节码文件(.class
文件)解释或编译成计算机能够执行的机器码,并在计算机上执行。
执行引擎的工作原理可以分为两个部分:解释执行和即时编译(Just-In-Time Compilation,JIT)。
- 解释执行:当 Java 程序启动时,执行引擎首先采用解释执行的方式逐条解释字节码指令并执行。这种方式虽然较慢,但它具有启动速度快、无需额外编译时间的优点。解释执行过程中,执行引擎会检查每个字节码指令的合法性,并根据需要加载相应的类、创建对象等,从而确保 Java 程序在运行时的安全性和稳定性。
- 即时编译:为了提高 Java 程序的执行效率,JVM 引入了即时编译技术。JIT 编译器会在程序运行过程中,将热点代码(即频繁执行的代码)编译成机器码存储起来。当这些热点代码再次被调用时,执行引擎可以直接执行已经编译好的机器码,从而提高程序的执行效率。JIT 编译器还具备一些优化策略,例如内联、循环展开等,可以进一步提高程序的执行效率。
本地库接口
本地库接口(Native Interface)是 Java 虚拟机的一部分,它允许 Java 程序调用本地方法库中的函数。本地方法库是用 C 或 C++ 编写的动态链接库,它提供了 Java 无法直接访问的底层资源,例如操作系统的 API、硬件设备等。
Java 本地方法接口(Java Native Interface,JNI)是 Java 虚拟机规范中定义的一套 API,它允许 Java 程序调用本地方法库中的函数。Java 本地方法接口提供了一种标准的机制,使得 Java 程序可以与本地方法库进行交互。
JNI 主要由三个部分组成:
- Java 类中的本地方法:在 Java 类中使用 native 关键字声明一个本地方法,标识该方法将由本地代码实现。
- JNI 头文件:使用 Java Native Interface 工具(如 javac、javah)生成本地方法的头文件。这个头文件中包含了本地方法的声明和参数列表等信息,用于指导本地代码的实现。
- 本地代码实现:根据生成的头文件,在本地代码中实现对应的本地方法。可以使用 C、C++ 等语言编写本地代码,并通过编译器将其编译成动态链接库(如 DLL 或 SO 文件)。