聊聊Go语言并发之道

时间:2022-12-26 09:55:08

聊聊Go语言并发之道

写在前面

  2007年,Go语言诞生于Google公司,2009年开源,2012年推出1.0版本,曾两次获得TIOBE年度语言。2012年起,全球大量的开源项目开始使用Go语言开发,目前Go语言已成为云计算领域事实上的标准语言,特别是在容器领域,诞生了一大批优秀的开源软件,如Docker,Kubernetes等。2017年区块链技术在国内大热,区块链两个大的技术平台以以太坊(Ethereum)和超级账本(Hyperledger)子项目Fabric都是基于Go语言构建的。Go语言的应用领域逐渐扩大,目前的区块链、云计算、中间件和服务器编程领域显现出明显的优势。Go语言最先在云计算盛行,随后大量的互联网初创企业将Go语言作为后台主要开发语言。目前,无论互联网公司的独角兽,还是BAT,都已将Go语言作为其技术栈的重要组成部分。市场对Go语言编程人才的需求量也在持续上升。所以今天聊聊Go语言的核心,并发。

什么是并发和并行

  当前环境下,CPU的工艺制程已经实现了7nm商用。可以预测单颗CPU的性能已经很难有指数级的提升,未来多核是主要的发展方向。硬件对软件的影响显而易见,软件的并发和并行也是未来的发展方向。并发和并行是两个不同的概念,应用程序具备好的并发结构,操作系统才能更好地利用硬件并行执行,同时避免阻塞等待,合理的进行调度,提高CPU利用率。

  • 并行意味着程序在任何时刻都是同时运行的,并行就是在任一粒度的时间内部具备同时执行的能力,具有瞬时性,在于执行。
  • 并发意味着程序在单位时间内是同时运行的,并发实在规定时间内多个请求都能得到执行和处理,具有过程性,在于结构。

GoRoutine

  操作系统本身可以进行线程和进程的调度,本身具备并发能力,但进程切换代价过于高昂,进程切换需要保存现场,耗费较多的时间。Go语言的并发思想就是让应用程序在用户层再构建一级调度将并发的粒度进一步降低,以更大限度地提高程序运行的效率呢。
  Go语言的并发执行体称为goroutine,routine的意思就是例程,所以goroutine叫go例程更合理,我还是习惯直接叫goroutine。

Go语言调度模型

  CPU执行指令的速度是非常快的,大部分简单的指令执行仅需三分之一纳秒,即1s可以执行30亿条简单指令,这个速度已经非常快了,CPU慢在对外部数据的读/写上,外部I/O的速度慢和阻塞是导致CPU使用效率不高的最大原因。在真实的系统中,CPU从来不是瓶颈,而是大部分的时间都被浪费了,所以我们需要增加CPU的有效吞吐量,尽可能让每个CPU核心都有事情做,尽可能提高每个CPU做事的效率。
  应用程序的并发模型是多样的,其中最高效的还是协程,Go的并发执行模型就是一种变种的协程模型。

MPG模型

Go语言天生支持并发,MPG模型是go语言的并发模型

聊聊Go语言并发之道

  • G - Goroutine: Go运行时对goroutine的抽象描述,存放兵法执行的代码入口地址、上下文、运行环境、运行栈等执行相关的元信息。
  • M - Machine:OS内核线程,是操作系统层面调度和执行的实体,负责执行。
  • P - Processor:M运行G时所需要的资源,对资源的一种抽象和管理,P不是一段代码实体,而是一个管理的数据结构, P主要降低M管理调度G的复杂性,增加一个间接的控制层数据结构。

Goroutine特点

  • 有独立的栈空间,共享程序堆空间
  • 调度由用户控制,不能保证多个goroutine的执行顺序
  • goroutine是一个轻量级的用户态的轻量级线程
  • goroutine从主线程开启的,是轻量级的线程,是逻辑态,对资源消耗相对小
  • goroutine可以轻松开启上万个线程。其他编程语言的并发机制是一般基于线程的,开启过多的线程,资源耗费大,这里更加可以体现出Go语言在并发上的优势了

Goroutine使用

普通函数启动goroutine

  代码中使用time模块阻塞了主进程,等待所有goroutine执行完毕后再结束程序,但是这样我们并不知道goroutine何时执行完毕,即对时间的把控没有一个参考,在go语言中,sync提供多个Goroutine同步机制,主要通过WaitGroup实现。

package main

import (
	"fmt"
	"time"
)

// 计算1-100的和
func calc() {
	total := 0
	for i := 0; i <= 100; i++ {
		total += i
	}

	fmt.Printf("%v", total)
}

func main() {
	go calc()

	// 阻塞主进程
	time.Sleep(time.Second)
}

WaitGroup

  sync包提供了多个Goroutine同步机制,主要通过WaitGroup实现。下面代码开启5个Goroutine,

package main

import (
	"fmt"
	"sync"
)

var wg sync.WaitGroup

// 计算1-100的和
func calc() {
  // wg.Done()方法等价于 wg.Add(-1)
	defer wg.Done()

	total := 0
	for i := 0; i <= 100; i++ {
		total += i
	}

	fmt.Printf("%v\n", total)
}

func main() {

	for i := 0; i < 5; i++ {
    // 每启动一个Goroutine,同时给wg加1
		wg.Add(1)
		go calc()
	}
	
  // 等待所有Goroutine运行完成
	wg.Wait()
}

Chan

  chan是Go语言的一个关键字,是channel的简写,goroutine是Go语言里面的并发执行体,chan是goroutine之间通信和同步的重要组件。然而在Go语言提倡通过通信来共享内存
  通道分为无缓冲通道和有缓冲通道,无缓冲通道的len和cap都为0。无缓冲通道既可以用于通信,也可以用于两个Goroutine之间同步,有缓冲通道主要用于通信。

使用无缓冲通道实现Goroutine之间同步等待:

package main

import "fmt"

// 计算1-100的和
func calc(c chan bool) {
	total := 0
	for i := 0; i <= 100; i++ {
		total += i
	}
  fmt.Printf("%v", total)
  
	c <- true
}

func main() {
  // 声明一个bool类型的无缓冲通道用来同步等待
	c := make(chan bool)
	go calc(c)

	// 同步等待
	<-c
}

总结

  Goroutine的工作方式,就是多个协程在多个线程上切换,既可以用到多核,又可以减少切换开销。不需要研发过度参与,提高代码效率,在研发过程中继续探寻吧。。。