垃圾回收主要思考三件事情:
- 哪种内存需要回收?
- 什么时候回收?
- 怎么回收?
这是一种非常简单易理解的回收算法。每当有一个地方引用一个对象的时候则在引用计数器上 +1,当失效的时候就 -1,无论什么时候计数器为 0 的时候则认为该对象死亡可以回收了。
这种算法虽然简单高效,但是却无法解决循环引用的问题,因此 Java 虚拟机并没有采用这种算法。
主流的语言其实都是采用可达性分析算法:
可达性算法是通过一个称为 GC Roots
的对象向下搜索,整个搜索路径就称为引用链,当一个对象到 GC Roots
没有任何引用链 JVM
就认为该对象是可以被回收的。
如图:Object1、2、3、4 都是存活的对象,而 Object5、6、7都是可回收对象。
可以用作 GC-Roots
的对象有:
- 方法区中静态变量所引用的对象。
- 虚拟机栈中所引用的对象。
标记清除算法分为两个步骤,标记和清除。 首先将不需要回收的对象标记起来,然后再清除其余可回收对象。但是存在两个主要的问题:
- 标记和清除的效率都不高。
- 清除之后容易出现不连续内存,当需要分配一个较大内存时就不得不需要进行一次垃圾回收。
标记清除过程如下:
复制算法是将内存划分为两块大小相等的区域,每次使用时都只用其中一块区域,当发生垃圾回收时会将存活的对象全部复制到未使用的区域,然后对之前的区域进行全部回收。
这样简单高效,而且还不存在标记清除算法中的内存碎片问题,但就是有点浪费内存。
在新生代会使用该算法。
新生代中分为一个 Eden
区和两个 Survivor
区。通常两个区域的比例是 8:1:1
,使用时会用到 Eden
区和其中一个 Survivor
区。当发生回收时则会将还存活的对象从 Eden
,Survivor
区拷贝到另一个 Survivor
区,当该区域内存也不足时则会使用分配担保利用老年代来存放内存。
复制算法过程:
复制算法如果在存活对象较多时效率明显会降低,特别是在老年代中并没有多余的内存区域可以提供内存担保。
所以老年代中使用的时候标记整理算法
,它的原理和标记清除算法
类似,只是最后一步的清除改为了将存活对象全部移动到一端,然后再将边界之外的内存全部回收。
现代多数的商用 JVM
的垃圾收集器都是采用的分代回收算法,和之前所提到的算法并没有新的内容。
只是将 Java 堆分为了新生代和老年代。由于新生代中存活对象较少,所以采用复制算法,简单高效。
而老年代中对象较多,并且没有可以担保的内存区域,所以一般采用标记清除或者是标记整理算法。