GO中的逃逸分析

原作者: [db:作者] 来自: [db:来源] 收藏邀请

以前写c/c++代码时，为了提高效率，常常将pass-by-value（传值）“升级”成pass-by-reference，企图避免构造函数的运行，并且直接返回一个指针。

那么这里还隐藏了一个很大的坑：在函数内部定义了一个局部变量，然后返回这个局部变量的地址（指针）。这些局部变量是在栈上分配的（静态内存分配），一旦函数执行完毕，变量占据的内存被销毁，任何对这个返回值的动作（如解引用），都将扰乱程序的运行，甚至导致程序直接崩溃。比如下面的这段代码：

int *foo ( void)   
{     
int t = 3;
return &t;
}

有些同学可能知道上面的这个坑，赢了更聪明的做法：在函数内部使用new函数构造一个变量（动态内存分配），然后返回此变量的地址。因为变量是在堆上创建的，所以函数退出时不会被销毁。但是，这样就行了吗？new出来的对象该在何时何处地delete呢?调用者可能忘记delete或者直接拿掉返回值传给其他函数，之后就再也不能delete它了，也就是发生可内存泄露。

C++是公认的语法最复杂的语言，据说没有人可以完全掌握C++的语法。而这一切在Go语言中就大不相同了。像上面示例的C++代码放到Go里，没有任何问题。

你表面的光鲜，一定是背后很多人为你支撑的！GO语言里就是编译器的逃逸分析。他是编译器执行静态代码分析后，对内存管理进行的优化和简化。

在编译原理中，分析指针动态范围的方法称之为逃逸分析。通俗来讲，当一个对象的指针被多个方法或线程引用时，我们称这个指针发生了逃逸。

更简单的来说，逃逸分析决定了一个变量是分配在堆上还是分配在栈上。

2、为什么要逃逸分析

前面讲的C/C++中出现的问题，在Go中作为一个语言特性被大力推崇。真是C/C++之砒霜Go之蜜糖！

C/C++中动态分配的内存需要我们手动释放，导致猿们平时在写程序时，如履薄冰。这样做有他的好处：程序员可以完全掌控内存。但是缺点也是很多的：经常出现忘记释放内存，导致内存泄露。所以，很多现代语言都加上了垃圾回收机制。

Go的垃圾回收，让堆和栈堆程序员完全透明，真正解放了程序员的双手，让他们可以专注于业务，”高效“的完成代码编写。把那些内存管理的复杂机制交给编译器，程序员可以去享受生活。

逃逸分析这种操作把变量合理的分配到了它该去的地方，”找准自己的位置“。即使你是用new申请的内存，如果我发现你竟然在退出函数后没有用了，那么就把你丢到栈上，毕竟栈上的内存分配比堆上快很多；反之，即使你表面上只是一个普通的变量，但是经过逃逸分析后发现退出函数之后还有其他地方在引用，那我就把你分配到堆上。真正的按需分配，提前实现共产主义。

如果变量都分配到堆上，堆不像栈可以自动清理。它会引起go频繁的进行垃圾回收，二垃圾回收会占用比较大的系统开销（占用cpu容量的25%）。

堆和栈相比，堆审核不可预知大小的内存分配。但是为此付出的代价是分配速度较慢，而且会形成内存碎片。栈内存分配比较快。栈分配内存只需要两个cpu指令：”PUSH“和”RELEASSE“,分配和释放；而堆分配内存首先需要找到一块大小合适的内存快，之后通过垃圾回收才能释放。

通过逃逸分析，可以尽量把那些不需要分配到堆上的变量直接分配到栈上，堆上的变量少了，会减轻分配堆内存的开销，同时减轻gc的压力，提高程序的原型速度。

3、逃逸分析是怎么完成的

Go中逃逸分析最基本的原则是：如果一个函数返回对一个变量的引用，那么它就发生逃逸。

简单来说，编译器会分析代码的特性和代码的生命周期，GO中变量只有在编译器可以证明在函数返回后不会再被引用的，才分配到栈上，其他情况都是分配到堆上。

GO语言没有一个关键字或者函数可以直接让变量被编译器分配到堆上，相反，编译器通过代码分析来决定将变量分配到何处。

对一个变量取地址，可能被分配到堆上。但是如果编译器进行逃逸分析后，如果考察到在函数返回后，此变量不会被引用，那么还是会被分配到栈上。

简单来说，编译器会根据变量是否被外部引用来决定是否逃逸：

1、如果函数外部没有引用，则优先放到栈中；

2、如果函数外部存在引用，则必定放到堆中;

针对第一条，可能放到堆上的情形：定义了一个很大的数组，需要申请的内存过大，超过了栈的存储能力。

4、逃逸分析实例

Go提供了相关的命令，可以查看变量是否发生逃逸。

还是用上面我们提到的例子：

func foo() *int {
    t := 3

    return &t
}

func main() {

    x := foo()

    fmt.Println(*x)

}

foo函数返回一个局部变量的指针，main函数里变量x接收它。执行如下命令：

go build -gcflags '-m -l' main.go

加-l是为了不让foo函数被内联。得到如下输出：

# command-line-arguments

src/main.go:7:9: &t escapes to heap

src/main.go:6:7: moved to heap: t

src/main.go:12:14: *x escapes to heap

src/main.go:12:13: main ... argument does not escape