使用Go语言时，谨防锁拷贝！

四哥水平有限，如有翻译或理解错误，烦请帮忙指出，感谢!

相信大家对 Go 语言的锁拷贝问题并不陌生，那我们应该如何规范使用Go 语言才能规避这个问题呢?一起来看作者是如何处理的。

原文如下：

假设我们有一个包含 map 的结构体，现在想在方法中修改这个 map，看下面的例子[1]：

package main
import "fmt"
type Container struct {
counters map[string]int
}
func (c Container) inc(name string) {
c.counters[name]++
}
func main() {
c := Container{counters: map[string]int{"a": 0, "b": 0}}
doIncrement := func(name string, n int) {
for i := 0; i < n; i++ {
c.inc(name)
}
}
doIncrement("a", 100000)
fmt.Println(c.counters)
}

Container 包含一个计数器集合，按 name 区分。inc() 会按 name 对相应的计数器执行自增操作(假设计数器存在)。main() 里循环多次调用 inc()。

执行上面的代码，输出：

map[a:100000 b:0]

现在假设有两个 goroutine 会并发地调用 inc()。因为我们必须小心竞争条件，所以使用了 Mutex 保护临界区。

package main
import (
"fmt"
"sync"
"time"
)
type Container struct {
sync.Mutex // <-- Added a mutex
counters map[string]int
}
func (c Container) inc(name string) {
c.Lock() // <-- Added locking of the mutex
defer c.Unlock()
c.counters[name]++
}
func main() {
c := Container{counters: map[string]int{"a": 0, "b": 0}}
doIncrement := func(name string, n int) {
for i := 0; i < n; i++ {
c.inc(name)
}
}
go doIncrement("a", 100000)
go doIncrement("a", 100000)
// Wait a bit for the goroutines to finish
time.Sleep(300 * time.Millisecond)
fmt.Println(c.counters)
}

你期望上面这段代码会输出什么呢?我得到的结果是这样的：

func (c *Container) inc(name string) {
c.Lock()
defer c.Unlock()
c.counters[name]++
}

我们使用 mutex 时已经很小心了，怎么还会出问题呢?你觉得应该如何修复这个问题?提示：只需要改动一个字符的代码就可以了!

代码的问题在于，无论何时调用 inc()，c 都会是一份拷贝，因为 inc() 是定义在 Container 上，而非 *Container;换句话说，c 是值接受者，而不是指针接受者。因此，inc() 并不能真正修改 c 的内容。

但等等，文章第一个示例是如何工作的?在单协程的例子中，c 也是按值传递，但是为什么能得到正确的结果 -- 在 inc() 在对 map 所做的修改，能影响到 main() 函数的原始值。这是因为 map 是引用类型而非值类型。Container 里保存的是指向 map 的指针，而不是 map 实际的数据。所以即使我们创建 Container 的副本，counters 保存的仍是指向 map 的地址。

所以文章第一个例子也是存在问题的，尽管执行结果没有问题，但是使用方法不符合官方指南[2] - 在方法中对原始数据进行修改，则方法应定义成指针方法，而非值方法。这里对 map 的使用给了我们一种错误的提示。作为练习，可以将第一个示例中的 map 换成 int 类型的计数器，并注意观察 inc() 的副本是如何递增的，在 inc() 中对副本做的修改不会影响到 main() 中的原始值。

Mutex 是值类型(可以看 Go 文档[3]相关的定义，包括注释里也明确地提示不能拷贝)，复制再使用是错误的。复制仅仅是创建了一个新的 mutex，很显然地，对计数器的互斥使用就失效了。

所以应该这样修改，定义 inc() 方法时在 Container 之前添加 *：

func (c *Container) inc(name string) {
c.Lock()
defer c.Unlock()
c.counters[name]++
}

c 通过指针方式传到方法中，指向的 Container 与 main() 函数里面的是同一个。

这个问题并不罕见，事实上，使用 go vet 命令就会发现这个问题：

$ go tool vet method-mutex-value-receiver.go
method-mutex-value-receiver.go:19: inc passes lock by value: main.Container

在我看来，实际上这个问题帮助我们理清了值接收者与指针接收者之间的区别。为了说明这一点，下面还有一个示例，这个示例与上面两个示例没有关系。这个示例使用到了 & 取值符和 %p 格式化输出变量的地址。

package main
import "fmt"
type Container struct {
i int
s string
}
func (c Container) byValMethod() {
fmt.Printf("byValMethod got &c=%p, &(c.s)=%p\n", &c, &(c.s))
}
func (c *Container) byPtrMethod() {
fmt.Printf("byPtrMethod got &c=%p, &(c.s)=%p\n", c, &(c.s))
}
func main() {
var c Container
fmt.Printf("in main &c=%p, &(c.s)=%p\n", &c, &(c.s))
c.byValMethod()
c.byPtrMethod()
}

执行代码后输出(如果在你的机器上执行，输出的地址可能不同，但是这不影响说明问题)：

in main &c=0xc00000a060, &(c.s)=0xc00000a068
byValMethod got &c=0xc00000a080, &(c.s)=0xc00000a088
byPtrMethod got &c=0xc00000a060, &(c.s)=0xc00000a068

main() 函数里创建了 Container 变量 c，并且输出它的地址和它的成员 s 的地址，接着调用了 Container 的两个方法。byValMethod() 是值接受者，因为是原值的拷贝所有打印的地址不一样。另一方面，byPtrMethod() 是指针接收者，输出的地址与 main() 函数输出的地址一致，因为调用时获取的是 c 实际的地址，而不是副本。

参考资料

[1]例子: https://github.com/eliben/code-for-blog/tree/master/2018/go-copying-mutex

[2]官方指南: https://golang.org/doc/faq#methods_on_values_or_pointers

[3]Go 文档: https://golang.org/src/sync/mutex.go

原文链接：https://mp.weixin.qq.com/s/zLbd0PclO9g6W0dg7pT3AQ

秒客网

使用Go语言时，谨防锁拷贝！

相关文章