golang 逃逸分析详解

缘起

前段时间跟项目组leader聊到golang编码规范时，我提到一个问题。

我：“golang函数传参是不是应该跟c一样，尽量不要直接传结构体，而要传结构体指针？“

leader：“不对，咱们项目很多都是直接传结构体的。“

我：“那样不会造成不必要的内存copy开销吗？”

leader：“确实会有，但这样可以减小gc压力，因为传值会在栈上分配，而一旦传指针，结构体就会逃逸到堆上。“

我：“有道理。。。“

由于之前是搞java的，关于逃逸分析在golang的上规则还不是很熟，因此，后来在心里一直记得：“一旦将某个局部变量以指针的方式传出，该变量就会逃逸到堆”。

但是我内心还是对这种说法一直存在疑惑，所以一直想找个机会好好学习一下。

什么是逃逸分析？

相信熟悉java的朋友对逃逸分析不会太陌生，这里引述周志明大大的原画：

在计算机语言编译器优化原理中，逃逸分析是指分析指针动态范围的方法，它同编译器优化原理的指针分析和外形分析相关联。当变量（或者对象）在方法中分配后，其指针有可能被返回或者被全局引用，这样就会被其他过程或者线程所引用，这种现象称作指针（或者引用）的逃逸(Escape)。

你学java时，老师在讲解jvm内存结构可能跟你说过这样一句话：“new出来的东西都在堆上，栈上存的是它的引用。”其实在现代JVM上这句话是不准确的，因为逃逸分析机制。

简单来说JVM的逃逸分析会在运行时检测当前方法栈帧内new出来的对象的引用是否被传出当前栈帧，传出则发生逃逸，未传出则未发生逃逸，例如：

public void test(){
    List a = new ArrayList();
    a.add(1); // a 未发生逃逸，因此在栈上分配
}

public List test1(){
    List a = new ArrayList();
    a.add(1);
    return a  //a 发生逃逸，因此分配在堆上
}

对于未发生逃逸的变量，则直接在栈上分配内存。因为栈上内存由在函数返回时自动回收，因此能减小gc压力。

准备

首先要明确几点：

不同于jvm的运行时逃逸分析，golang的逃逸分析是在编译期完成的。
Golang的逃逸分析只针对指针。一个值引用变量如果没有被取址，那么它永远不可能逃逸。

本文golang运行环境：

go version go1.13.4 darwin/amd64

另外，验证某个函数的变量是否发生逃逸的方法有两个：

go run -gcflags "-m -l" (-m打印逃逸分析信息，-l禁止内联编译)；例：

➜  testProj go run -gcflags "-m -l" internal/test1/main.go
# command-line-arguments
internal/test1/main.go:4:2: moved to heap: a
internal/test1/main.go:5:11: main make([]*int, 1) does not escape

go tool compile -S main.go | grep runtime.newobject（汇编代码中搜runtime.newobject指令，该指令用于生成堆对象）,例：

➜  testProj go tool compile -S internal/test1/main.go | grep newobject
        0x0028 00040 (internal/test1/main.go:4) CALL    runtime.newobject(SB)

备注：关于-gcflags "-m -l"的输出，有两种情况
moved to heap:xxx
xxx escapes to heap
根据我个人的实验结果，二者都表示发生逃逸，当xxx变量类型为指针时，出现下一种；当xxx变量为值类型时，为上一种。有兴趣的可以用上边的命令跑一下下边的代码
type S int
func main() {
a := S(0)
b := make([]*S, 2)
b[0] = &a
c := new(S)
b[1] = c
}
在stack overflow上有个回答https://stackoverflow.com/questions/51518742/what-is-the-meaning-of-the-output-from-go-run-gcflags-m-xxx-go，应该是错的，至少go版本13.4是错的。