Go 有哪几种无法恢复的致命场景?

时间:2022-11-10 17:40:18

Go 有哪几种无法恢复的致命场景?

大家好,我是煎鱼。

有一次事故现场,在紧急恢复后,他正在排查代码,查了好一会。我回头一看,这错误提醒很明显就是致命错误,较好定位。

但此时,他竟然在查 panic-recover 是不是哪里漏了,我表示大受震惊...

今天就由煎鱼给大家分享一下错误类型有哪几种,又在什么场景下会触发。

错误类型

error

第一种是 Go 中最标准的 error 错误,其真身是一个 interface{}。

如下:

  1. type error interface {
  2. Error() string
  3. }

在日常工程中,我们只需要创建任意结构体,实现了 Error 方法,就可以认为是 error 错误类型。

如下:

  1. type errorString struct {
  2. s string
  3. }
  4. func (e *errorString) Error() string {
  5. return e.s
  6. }

在外部调用标准库 API,一般如下:

  1. f, err := os.Open("filename.ext")
  2. if err != nil {
  3. log.Fatal(err)
  4. }
  5. // do something with the open *File f

我们会约定最后一个参数为 error 类型,一般常见于第二个参数,可以有个约定俗成的习惯。

panic

第二种是 Go 中的异常处理 panic,能够产生异常错误,结合 panic+recover 可以扭转程序的运行状态。

如下:

  1. package main
  2. import "os"
  3. func main() {
  4. panic("a problem")
  5. _, err := os.Create("/tmp/file")
  6. if err != nil {
  7. panic(err)
  8. }
  9. }

输出结果:

  1. $ go run panic.go
  2. panic: a problem
  3. goroutine 1 [running]:
  4. main.main()
  5. /.../panic.go:12 +0x47
  6. ...
  7. exit status 2

如果没有使用 recover 作为捕获,就会导致程序中断。也因此经常被人误以为程序中断,就 100% 是 panic 导致的。

这是一个误区。

throw

第三种是 Go 初学者经常踩坑,也不知道的错误类型,那就是致命错误 throw。

这个错误类型,在用户侧是没法主动调用的,均为 Go 底层自行调用的,像是大家常见的 map 并发读写,就是由此触发。

其源码如下:

  1. func throw(s string) {
  2. systemstack(func() {
  3. print("fatal error: ", s, "\n")
  4. })
  5. gp := getg()
  6. if gp.m.throwing == 0 {
  7. gp.m.throwing = 1
  8. }
  9. fatalthrow()
  10. *(*int)(nil) = 0 // not reached
  11. }

根据上述程序,会获取当前 G 的实例,并设置其 M 的 throwing 状态为 1。

状态设置好后,会调用 fatalthrow 方法进行真正的 crash 相关操作:

  1. func fatalthrow() {
  2. pc := getcallerpc()
  3. sp := getcallersp()
  4. gp := getg()
  5. systemstack(func() {
  6. startpanic_m()
  7. if dopanic_m(gp, pc, sp) {
  8. crash()
  9. }
  10. exit(2)
  11. })
  12. *(*int)(nil) = 0 // not reached
  13. }

主体逻辑是发送 _SIGABRT 信号量,最后调用 exit 方法退出,所以你会发现这是拦也拦不住的 “致命” 错误。

致命场景

为此,作为一名 “成熟” 的 Go 工程师,除了保障自己程序的健壮性外,我也在网上收集了一些致命的错误场景,分享给大家。

一起学习和规避这些致命场景,年底争取拿个 A,不要背上 P0 事故。

并发读写 map

  1. func foo() {
  2. m := map[string]int{}
  3. go func() {
  4. for {
  5. m["煎鱼1"] = 1
  6. }
  7. }()
  8. for {
  9. _ = m["煎鱼2"]
  10. }
  11. }

输出结果:

  1. fatal error: concurrent map read and map write
  2. goroutine 1 [running]:
  3. runtime.throw(0x1078103, 0x21)
  4. ...

堆栈内存耗尽

  1. func foo() {
  2. var f func(a [1000]int64)
  3. f = func(a [1000]int64) {
  4. f(a)
  5. }
  6. f([1000]int64{})
  7. }

输出结果:

  1. runtime: goroutine stack exceeds 1000000000-byte limit
  2. runtime: sp=0xc0200e1bf0 stack=[0xc0200e0000, 0xc0400e0000]
  3. fatal error: stack overflow
  4. runtime stack:
  5. runtime.throw(0x1074ba3, 0xe)
  6. /usr/local/Cellar/go/1.16.6/libexec/src/runtime/panic.go:1117 +0x72
  7. runtime.newstack()
  8. ...

将 nil 函数作为 goroutine 启动

  1. func foo() {
  2. var f func()
  3. go f()
  4. }

输出结果:

  1. fatal error: go of nil func value
  2. goroutine 1 [running]:
  3. main.foo()
  4. ...

goroutines 死锁

  1. func foo() {
  2. select {}
  3. }

输出结果:

  1. fatal error: all goroutines are asleep - deadlock!
  2. goroutine 1 [select (no cases)]:
  3. main.foo()
  4. ...

线程限制耗尽

如果你的 goroutines 被 IO 操作阻塞了,新的线程可能会被启动来执行你的其他 goroutines。

Go 的最大的线程数是有默认限制的,如果达到了这个限制,你的应用程序就会崩溃。

会出现如下输出结果:

  1. fatal error: thread exhaustion
  2. ...

可以通过调用 runtime.SetMaxThreads 方法增大线程数,不过也需要考量是否程序有问题。

超出可用内存

如果你执行的操作,例如:下载大文件等。导致应用程序占用内存过大,程序上涨,导致 OOM。

会出现如下输出结果:

  1. fatal error: runtime: out of memory
  2. ...

建议处理掉一些程序,或者换新电脑了。

总结

在今天这篇文章中,我们介绍了 Go 语言的三种错误类型。其中针对大家最少见,但一碰到就很容易翻车的致命错误 fatal error 进行了介绍,给出了一些经典案例。

希望大家后续能够规避,你有没有遇到过其中的场景?

欢迎在评论区交流和留言:)

参考

Are all runtime errors recoverable in Go?

原文链接:https://mp.weixin.qq.com/s/gSfzrSKYbZTP8COz4lZKHQ