四哥水平有限,如有翻译或理解错误,烦请帮忙指出,感谢!
相信大家对 Go 语言的锁拷贝问题并不陌生,那我们应该如何规范使用Go 语言才能规避这个问题呢?一起来看作者是如何处理的。
原文如下:
假设我们有一个包含 map 的结构体,现在想在方法中修改这个 map,看下面的例子[1]:
- package main
- import "fmt"
- type Container struct {
- counters map[string]int
- }
- func (c Container) inc(name string) {
- c.counters[name]++
- }
- func main() {
- c := Container{counters: map[string]int{"a": 0, "b": 0}}
- doIncrement := func(name string, n int) {
- for i := 0; i < n; i++ {
- c.inc(name)
- }
- }
- doIncrement("a", 100000)
- fmt.Println(c.counters)
- }
Container 包含一个计数器集合,按 name 区分。inc() 会按 name 对相应的计数器执行自增操作(假设计数器存在)。main() 里循环多次调用 inc()。
执行上面的代码,输出:
- map[a:100000 b:0]
现在假设有两个 goroutine 会并发地调用 inc()。因为我们必须小心竞争条件,所以使用了 Mutex 保护临界区。
- package main
- import (
- "fmt"
- "sync"
- "time"
- )
- type Container struct {
- sync.Mutex // <-- Added a mutex
- counters map[string]int
- }
- func (c Container) inc(name string) {
- c.Lock() // <-- Added locking of the mutex
- defer c.Unlock()
- c.counters[name]++
- }
- func main() {
- c := Container{counters: map[string]int{"a": 0, "b": 0}}
- doIncrement := func(name string, n int) {
- for i := 0; i < n; i++ {
- c.inc(name)
- }
- }
- go doIncrement("a", 100000)
- go doIncrement("a", 100000)
- // Wait a bit for the goroutines to finish
- time.Sleep(300 * time.Millisecond)
- fmt.Println(c.counters)
- }
你期望上面这段代码会输出什么呢?我得到的结果是这样的:
- func (c *Container) inc(name string) {
- c.Lock()
- defer c.Unlock()
- c.counters[name]++
- }
我们使用 mutex 时已经很小心了,怎么还会出问题呢?你觉得应该如何修复这个问题?提示:只需要改动一个字符的代码就可以了!
代码的问题在于,无论何时调用 inc(),c 都会是一份拷贝,因为 inc() 是定义在 Container 上,而非 *Container;换句话说,c 是值接受者,而不是指针接受者。因此,inc() 并不能真正修改 c 的内容。
但等等,文章第一个示例是如何工作的?在单协程的例子中,c 也是按值传递,但是为什么能得到正确的结果 -- 在 inc() 在对 map 所做的修改,能影响到 main() 函数的原始值。这是因为 map 是引用类型而非值类型。Container 里保存的是指向 map 的指针,而不是 map 实际的数据。所以即使我们创建 Container 的副本,counters 保存的仍是指向 map 的地址。
所以文章第一个例子也是存在问题的,尽管执行结果没有问题,但是使用方法不符合官方指南[2] - 在方法中对原始数据进行修改,则方法应定义成指针方法,而非值方法。这里对 map 的使用给了我们一种错误的提示。作为练习,可以将第一个示例中的 map 换成 int 类型的计数器,并注意观察 inc() 的副本是如何递增的,在 inc() 中对副本做的修改不会影响到 main() 中的原始值。
Mutex 是值类型(可以看 Go 文档[3]相关的定义,包括注释里也明确地提示不能拷贝),复制再使用是错误的。复制仅仅是创建了一个新的 mutex,很显然地,对计数器的互斥使用就失效了。
所以应该这样修改,定义 inc() 方法时在 Container 之前添加 *:
- func (c *Container) inc(name string) {
- c.Lock()
- defer c.Unlock()
- c.counters[name]++
- }
c 通过指针方式传到方法中,指向的 Container 与 main() 函数里面的是同一个。
这个问题并不罕见,事实上,使用 go vet 命令就会发现这个问题:
- $ go tool vet method-mutex-value-receiver.go
- method-mutex-value-receiver.go:19: inc passes lock by value: main.Container
在我看来,实际上这个问题帮助我们理清了值接收者与指针接收者之间的区别。为了说明这一点,下面还有一个示例,这个示例与上面两个示例没有关系。这个示例使用到了 & 取值符和 %p 格式化输出变量的地址。
- package main
- import "fmt"
- type Container struct {
- i int
- s string
- }
- func (c Container) byValMethod() {
- fmt.Printf("byValMethod got &c=%p, &(c.s)=%p\n", &c, &(c.s))
- }
- func (c *Container) byPtrMethod() {
- fmt.Printf("byPtrMethod got &c=%p, &(c.s)=%p\n", c, &(c.s))
- }
- func main() {
- var c Container
- fmt.Printf("in main &c=%p, &(c.s)=%p\n", &c, &(c.s))
- c.byValMethod()
- c.byPtrMethod()
- }
执行代码后输出(如果在你的机器上执行,输出的地址可能不同,但是这不影响说明问题):
- in main &c=0xc00000a060, &(c.s)=0xc00000a068
- byValMethod got &c=0xc00000a080, &(c.s)=0xc00000a088
- byPtrMethod got &c=0xc00000a060, &(c.s)=0xc00000a068
main() 函数里创建了 Container 变量 c,并且输出它的地址和它的成员 s 的地址,接着调用了 Container 的两个方法。byValMethod() 是值接受者,因为是原值的拷贝所有打印的地址不一样。另一方面,byPtrMethod() 是指针接收者,输出的地址与 main() 函数输出的地址一致,因为调用时获取的是 c 实际的地址,而不是副本。
参考资料
[1]例子: https://github.com/eliben/code-for-blog/tree/master/2018/go-copying-mutex
[2]官方指南: https://golang.org/doc/faq#methods_on_values_or_pointers
[3]Go 文档: https://golang.org/src/sync/mutex.go
原文链接:https://mp.weixin.qq.com/s/zLbd0PclO9g6W0dg7pT3AQ