写在前面:
因为了解越多发现自己不懂的越多,连整理归纳笔记都变得吃力了起来,所以「GC算法系列」就暂时告一段落了。希望沉淀一段时间后,回头再看的时候会有更深刻的理解。
前几篇笔记介绍了几种基本的垃圾回收算法,那么是不是堆上所有的对象都是由相同的垃圾算法管理的呢?而且所有的垃圾都是在同一时间得到回收的呢?答案自然是否定的。
事实上,根据不同对象的存活特性,如果我们针对性地处理不同的对象的话,对垃圾回收的性能提升是非常有效的。目前应用最广泛的例子就是 —— 分代垃圾回收 (Generational garbage collection)。分代垃圾回收的基本思想就是根据对象的年龄进行分隔,优先回收更年轻的对象。
接下来,我们稍微深入地聊一聊堆分区与分代垃圾回收那些事吧~
为什么要进行分区
将堆分割成多个分区,每个分区采用不同的管理策略通常能更好地利用结合对象的移动性、大小和类别等性质,获得更低的空间消耗、更简单的对象性质识别、改善垃圾回收效率、降低停顿时间、更好的局部性等。
移动性与分区
对于一个混合回收器,识别哪些对象可移动、哪些对象不可移动或移动代价很大是十分必要的。对于移动式 GC,必须找到所有指向这个对象的引用;相反,如果是非移动式 GC,则只需要找到至少一个引用就够了。而当一个引用被传给一个根本不关心垃圾回收的程序库时,这个对象就不能被移动了。此时,要么这个对象被钉住不动,要么我们要保证在程序库访问期间不能在其所处空间执行垃圾回收。对象大小与分区
移动大对象的代价可能比不移动而放弃消除碎片的代价大。因此,一个常用策略是将大小超过一定阈值的对象分配到一个专门的大对象空间 (Large object space, LOS) 中去,并使用像标记-清除这样的非移动式 GC 进行管理。(通常不会采用复制式 GC 回收大对象,因为为对象预留复制空间代价高昂。)对象生命周期与分区
对于生命周期长且内存碎片对其并非急需处理的对象来说,可以将其保存在一个采用非移动 GC,偶尔会进行一趟扫描进行整理的空间;对于分配频率高、生命周期短、死亡率更高的对象则可以放到一个由份额皮速度快、回收代价小的复制式 GC 管理的空间中去。对象类别与分区
将不同类别的对象进行物理隔离可以让“类型”这样的属性通过对象地址就可以识别,而无需读取对象的某一字段。这样做将所有共享相同属性的对象放在同一空间中,避免了在每个对象头部复制一套重复的属性。对象用途与分区
回收器可能会根据对象的物理分布采取不同的处理策略。有研究者提出,在一个应用程序服务器中,作为客户端请求的一部分而初始化的远程对象往往比本地对象存活的时间长。通常,在一个采用分布式 GC 管理的系统中,最好能使用不同的策略管理远程和本地的对象和引用,因为访问远程对象的代价比本地大几个数量级。对象易变性与分区
相对于存活时间较长的对象,新创建的对象往往被修改得更频繁,因此引用计数法就不太适用于这类频繁更新的对象。
何时进行分区
分区的决策既可以是静态 (编译器) 完成,可以动态进行。
静态分区 - 通过对对象的类型、代码或者其他信息的分析,对象所属空间可以被静态的划定。(比如编译器预分配)
动态分区
- 在对象被创建时 - 分配器会根据对象所需要的内存大小来决定对象是否要被分配到大对象空间中。
- 在垃圾回收期间 - 例如在分代垃圾回收中,分区是由回收器动态执行的,当一个对象的年龄增长超过某个阈值的时候,这个对象就被从物理上或逻辑上移动到下一个分代的空间中。
- 当赋值器访问对象时 - 在并发回收器中,赋值器访问对象的操作可能会被读屏障或写屏障居中调节,从而导致一个或多个对象被移动或标记。
分代垃圾回收
分代垃圾回收的出现基于根据经验后得出的一条结论 —— 大多数对象都在年轻时死亡,又被称为“弱分代假说 (Weak generational hypothesis)”。这一假说已在各种不同种类的编程范式和编程语言中得到证实。(事实证明,它们就是轻易地 go die 了,⊙︿⊙
新生代与老年代
分代垃圾回收按照对象的年龄 (age) 将其划分为不同的分代,同时将不同分代的对象置于堆中的不同区域。回收器会优先回收新生代,对象的年龄随从垃圾回收中存活的次数递增,当年新生代中的对象年龄达到一定阈值,将被提升 (promote) 到更老的一代。
「一些术语」
- 新生代 GC (Minor GC) - 在新生代中执行的 GC
- 对象提升 (Promotion) - 将新生代中的对象提升为老年代对象的过程
- 老年代 GC (Major GC) - 在老年代中执行的 GC
下面我们将介绍由 David Ungar 于 1984 年在文章 Generation Scavenging: A Non-disruptlve High Perfornmance Storage Reclamation Algorithm 中提出的分代回收算法。
Ungar 的分代垃圾回收
Ungar 提出的分代垃圾回收将堆分为4个空间,三个用于新生代,一个用于老年代,它们分别是:
- NewSpace - 用于创建对象的空间,也就是进行分配的空间
- PastSurvivorSpace - 保存上一次 Minor GC 后存活的对象,相当于复制 GC 中的 From 空间
- FutureSurvivorSpace - 一个空的空间,相当于复制 GC 中的 To 空间
- OldSpace - 存放老年代对象的空间
NewSpace 通常是 SurvivorSpace 的 N 倍,根据弱分代假说,绝大多数 NewSpace 中的对象都会死亡,因此这样分配空间有利于提高堆空间利用率。
执行新生代 GC 会将 NewSpace 和 PastSurvivorSpace 中的活动对象复制到 FutureSurvivorSpace 中,然后清除这两个空间,最后将 PastSurvivorSpace 和 FutureSurvivorSpace交换,跟复制 GC 是一样的。这一过程中,如果发现新生代对象已经经历了一定次数的新生代 GC,它就会得到晋升,被复制到老年代中去。如果老年代空间也满了,那就要执行老年代 GC。老年代 GC 可以采用标记-清除算法。
虽然新生代和老年代被分开进行回收,但对象间的引用却是交叉存在于两个分代间的。那么当进行新生代 GC 时,除了要复制由 GC Roots 引用的对象外,被老年代中的对象引用的新生代对象也属于活动对象。那么,要如何管理这二者之间的引用关系呢?
为了解决这个问题,需要引入两个新概念:记录集 (Remembered Set) 和写屏障 (Write Barrier)。
记录集
记录集 (Remembered Set) 用来记录老年代中引用了新生代中对象的对象,注意,这里记录的是引用方,而不是被引用方。
为什么不反过来记录被引用的对象呢?
试想一下,如果记录集中保存的是被引用的对象,一旦这个对象被提升为老年代,就没办法更新老年代中引用它的指针了。因为记录集中没有存储“某老年代对象 A 引用了某新生代对象 B”这一信息。反过来,如果记录的是老年代中的引用方,就不存在这个问题了。
写屏障
以下定义摘自维基百科:
A write barrier in a garbage collector is a fragment of code emitted by the compiler immediately before every store operation to ensure that generational invariants are maintained.
通过写屏障我们将老年代中引用了新生代对象的对象记录到记录集里。
伪码如下:1
2
3
4
5
6
7
8
9
10write_barrier(obj, new_obj, field) {
// 检查引用方是否老年代对象,检查被引用方是否新生代对象
// 如果老年代对象尚未被加入记录集,则将其加入
if (is_old_gen(obj) && is_young_gen(new_obj) && obj.remembered == FALSE) {
remembered_set.add(obj)
obj.remembered = TRUE
}
// 更新指针
update_field(obj, new_obj, field)
}
对象结构
在 Ungar 的分代垃圾回收中,对象的头部要添加如下信息:
- 对象的年龄 (age) - 表示对象从新生代 GC 中存活下来的次数,当这个值超过一定次数,该对象就会被提升到老年代
- 复制完毕的标志 (forwarded) - 用于防止在 GC 时重复复制的标志
- 添加到记录集的标志 (remembered) - 用于防止向记录集中重复记录的标志 (只用于老年代对象,而另外两个只用于新生代对象)
算法伪码
Ungar 分代垃圾回收算法伪码如下 (摘自《垃圾回收的算法与实现》):
为新对象分配空间:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18new_obj(size) {
// $new_free指向NewSpace空闲分块,如果空间不够则进行一次新生代GC
if ($new_free + size >= $survivor1_start) {
minor_gc()
// 如果还不够,则空间不足,分配失败。当然,更复杂的做法,也可以考虑将对象分配到老年代空间
if ($new_free + size >= $survivor1_start) {
allocation_fail()
}
}
// 分配成功,进行对象初始化操作
obj = $new_free
$new_free += size
obj.age = 0
obj.forwarded = FALSE
obj.remembered = FALSE
obj.size = size
return obj
}
新生代 GC:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55minor_gc() {
$to_survivor_free = $to_survivor_start
// 复制所有不在老年代中的GC Roots
for (r: $roots) {
if (*r < $old_start) {
*r = copy(*r)
}
}
i = 0
while (i < $rs_index) {
// 用于判断当前这个记录集的对象是否还有引用新生代对象
has_new_obj = FALSE
// 遍历记录集,复制被老年代对象引用的新生代对象
for (child: children($rs[i])) {
// 检查该对象是否已经提升到老年代空间,如果没有,则进行复制并设置标志位
if (*child < $old_start) {
*child = copy(*child)
if (*child < $old_start) {
has_new_obj = TRUE
}
}
}
// 如果没有引用新生代对象,则将其从记录集中移除
if (has_new_obj == FALSE) {
$rs[i].remembered = FALSE
$rs_index--
swap($rs[i], $rs[$rs_index])
} else {
i++
}
}
// From空间与To空间互换
swap($from_survivor_start, $to_survivor_start)
}
copy(obj) {
if (obj.forwarded == FALSE) {
// 如果对象还够年轻,则将其从NewSpace或From空间复制到To空间
if (obj.age < AGE_MAX) {
copy_data($to_survivor_free, obj, obj.size)
obj.forwarded = TRUE
obj.forwarding = $to_survivor_free
// 经历了一次新生代GC,别忘了年龄也要递增
$to_survivor_free.age++
$to_survivor_free += obj.size
for (child: children(obj)) {
*child = copy(*child)
}
} else {
// 否则将它提升到老年代
promote(obj)
}
}
return obj.forwarding
}
将新生代对象提升到老年代:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23promote(obj) {
// 首先在老年代中为对象分配空间
new_obj = allocation_in_old(obj)
// 如果分配失败,则执行老年代GC,如果还失败,那就是真的没空间了,分配失败
if (new_obj == NULL) {
major_gc()
new_obj = allocation_in_old(obj)
if (new_obj == NULL) {
allocation_fail()
}
}
obj.forwarding = new_obj
obj.forwarded = TRUE
for (child: children(obj)) {
// 如果这个被提升的对象有引用新生代的对象,那么记得把它加到记录集中
if (*child < $old_start) {
$rs[$rs_index] = new_obj
$rs_index++
new_obj.remembered = TRUE
return
}
}
}
多分代
除了简单的划分新生代与老年代之外,也可根据对象的生命周期分布划分更多的中间代。如果相当一部分新生代对象会活过新生代回收,但是在被提升到老年代之后不久便死亡,则可以增加中间分代。不过实际应用中,大多数系统都只提供两个分代外加一个永久对象分代。毕竟分代越多,每个分代的空间会被小,各代之间的引用变多变复杂,垃圾回收过程也更复杂,时间开销不一定会更少。
分代回收的优缺点
优点
- 提升程序的整体吞吐量 - 生命周期长的对象的处理频率低,减少了处理开销,并且使得中年对象有足够的时间达到死亡而不需要对其进行追踪;分代回收在为新对象分配时通常采用顺序分配策略,内存访问模式的可预测性提升了程序的局部性,且大多数写操作是针对新生代发生的,赋值器的局部性也得到了提升。
缺点
- 性能表现严重依赖程序中对象的生命周期分布 - 如果新生代对象的死亡率不够高,则分代回收策略可能就不再适用了。
- 无法避免整堆回收,因此无法降低最大停顿时间 - 不能满足对回收停顿时间有最大值限制的硬实时(hard real-time) 回收要求。
分代垃圾回收的策略只是进行堆区分以提升回收效率的方式之一,不过也是目前使用最为广泛的分区策略。除此之外还有很多其他的分区策略。甚至是分代策略自身也有很多需要考虑的细节。
不得不说,《垃圾回收算法手册:自动内存管理的艺术》这本书涉猎得内容很深且广,很多章节之间会有跳跃着的关联,而且作者经常就着一个小话题会给出很多相关的论文或观点,不愧是被称之为艺术的话题。相比之下《垃圾回收的算法与实现》这本书对小白更友好一些,介绍的都是算法最基础的思路和实现。两本书的阅读难度系数完全不是一个档次,前者对于我目前的水平还是挺吃力的。
后会有期~
参考资料
- 垃圾回收的算法与实现
- 垃圾回收算法手册:自动内存管理的艺术
- David Ungar, Generation Scavenging: A Non-disruptlve High Perfornmance Storage Reclamation Algorithm, 1984
- Write Barrier - Wiki