title: 【轉載】Go 語言基礎之並發
date: 2021-08-09 16:39:33
comment: false
toc: true
category:
- Golang
tags: - 轉載
- Go
- 基礎
- 並發
本文轉載自:Go 語言基礎之並發 | 李文周的博客
並發是編程裡面一個非常重要的概念,Go 語言在語言層面天生支持並發,這也是 Go 語言流行的一個很重要的原因。
Go 語言中的並發編程#
並發與並行#
並發:同一時間段內執行多個任務(你在用微信和兩個女朋友聊天)。
並行:同一時刻執行多個任務(你和你朋友都在用微信和女朋友聊天)。
Go 語言的並發通過goroutine
實現。goroutine
類似於線程,屬於用戶態的線程,我們可以根據需要創建成千上萬個goroutine
並發工作。goroutine
是由 Go 語言的運行時(runtime)調度完成,而線程是由操作系統調度完成。
Go 語言還提供channel
在多個goroutine
間進行通信。goroutine
和channel
是 Go 語言秉承的 CSP(Communicating Sequential Process)並發模式的重要實現基礎。
goroutine#
在 java/c++ 中我們要實現並發編程的時候,我們通常需要自己維護一個線程池,並且需要自己去包裝一個又一個的任務,同時需要自己去調度線程執行任務並維護上下文切換,這一切通常會耗費程序員大量的心智。那么能不能有一種機制,程序員只需要定義很多個任務,讓系統去幫助我們把這些任務分配到 CPU 上實現並發執行呢?
Go 語言中的goroutine
就是這樣一種機制,goroutine
的概念類似於線程,但 goroutine
是由 Go 的運行時(runtime)調度和管理的。Go 程序會智能地將 goroutine 中的任務合理地分配給每個 CPU。Go 語言之所以被稱為現代化的編程語言,就是因為它在語言層面已經內置了調度和上下文切換的機制。
在 Go 語言編程中你不需要去自己寫進程、線程、協程,你的技能包裡只有一個技能–goroutine
,當你需要讓某個任務並發執行的時候,你只需要把這個任務包裝成一個函數,開啟一個goroutine
去執行這個函數就可以了,就是這麼簡單粗暴。
使用 goroutine#
Go 語言中使用goroutine
非常簡單,只需要在調用函數的時候在前面加上go
關鍵字,就可以為一個函數創建一個goroutine
。
一個goroutine
必定對應一個函數,可以創建多個goroutine
去執行相同的函數。
啟動單個 goroutine#
啟動 goroutine 的方式非常簡單,只需要在調用的函數(普通函數和匿名函數)前面加上一个go
關鍵字。
舉個例子如下:
func hello() {
fmt.Println("Hello Goroutine!")
}
func main() {
hello()
fmt.Println("main goroutine done!")
}
這個示例中 hello 函數和下面的語句是串行的,執行的結果是打印完Hello Goroutine!
後打印main goroutine done!
。
接下來我們在調用 hello 函數前面加上關鍵字go
,也就是啟動一個 goroutine 去執行 hello 這個函數。
func main() {
go hello() // 啟動另外一個goroutine去執行hello函數
fmt.Println("main goroutine done!")
}
這一次的執行結果只打印了main goroutine done!
,並沒有打印Hello Goroutine!
。為什麼呢?
在程序啟動時,Go 程序就會為main()
函數創建一個默認的goroutine
。
當 main () 函數返回的時候該goroutine
就結束了,所有在main()
函數中啟動的goroutine
會一同結束,main
函數所在的goroutine
就像是權利的遊戲中的夜王,其他的goroutine
都是異鬼,夜王一死它轉化的那些異鬼也就全部 GG 了。
所以我們要想辦法讓 main 函數等一等 hello 函數,最簡單粗暴的方式就是time.Sleep
了。
func main() {
go hello() // 啟動另外一個goroutine去執行hello函數
fmt.Println("main goroutine done!")
time.Sleep(time.Second)
}
執行上面的代碼你會發現,這一次先打印main goroutine done!
,然後緊接著打印Hello Goroutine!
。
首先為什麼會先打印main goroutine done!
是因為我們在創建新的 goroutine 的時候需要花費一些時間,而此時 main 函數所在的goroutine
是繼續執行的。
啟動多個 goroutine#
在 Go 語言中實現並發就是這樣簡單,我們還可以啟動多個goroutine
。讓我們再來一個例子: (這裡使用了sync.WaitGroup
來實現 goroutine 的同步)
var wg sync.WaitGroup
func hello(i int) {
defer wg.Done() // goroutine結束就登記-1
fmt.Println("Hello Goroutine!", i)
}
func main() {
for i := 0; i < 10; i++ {
wg.Add(1) // 啟動一個goroutine就登記+1
go hello(i)
}
wg.Wait() // 等待所有登記的goroutine都結束
}
多次執行上面的代碼,會發現每次打印的數字的順序都不一致。這是因為 10 個goroutine
是並發執行的,而goroutine
的調度是隨機的。
goroutine 與線程#
可增長的棧#
OS 線程(操作系統線程)一般都有固定的棧內存(通常為 2MB), 一個goroutine
的棧在其生命周期開始時只有很小的棧(典型情況下 2KB),goroutine
的棧不是固定的,他可以按需增大和縮小,goroutine
的棧大小限制可以達到 1GB,雖然極少會用到這麼大。所以在 Go 語言中一次創建十萬左右的goroutine
也是可以的。
goroutine 調度#
GPM
是 Go 語言運行時(runtime)層面的實現,是 go 語言自己實現的一套調度系統。區別於操作系統調度 OS 線程。
G
很好理解,就是個 goroutine 的,裡面除了存放本 goroutine 信息外 還有與所在 P 的綁定等信息。P
管理著一組 goroutine 隊列,P 裡面會存儲當前 goroutine 運行的上下文環境(函數指針,堆棧地址及地址邊界),P 會對自己管理的 goroutine 隊列做一些調度(比如把佔用 CPU 時間較長的 goroutine 暫停、運行後續的 goroutine 等等)當自己的隊列消費完了就去全局隊列裡取,如果全局隊列裡也消費完了會去其他 P 的隊列裡搶任務。M(machine)
是 Go 運行時(runtime)對操作系統內核線程的虛擬, M 與內核線程一般是一一映射的關係, 一個 groutine 最終是要放到 M 上執行的;
P 與 M 一般也是一一對應的。他們關係是: P 管理著一組 G 掛載在 M 上運行。當一個 G 長久阻塞在一個 M 上時,runtime 會新建一個 M,阻塞 G 所在的 P 會把其他的 G 掛載在新建的 M 上。當舊的 G 阻塞完成或者認為其已經死掉時 回收舊的 M。
P 的個數是通過runtime.GOMAXPROCS
設置(最大 256),Go1.5 版本之後默認為物理線程數。 在並發量大的時候會增加一些 P 和 M,但不會太多,切換太頻繁的話得不償失。
單從線程調度講,Go 語言相比起其他語言的優勢在於 OS 線程是由 OS 內核來調度的,goroutine
則是由 Go 運行時(runtime)自己的調度器調度的,這個調度器使用一個稱為 m調度的技術(復用 / 調度 m 個 goroutine 到 n 個 OS 線程)。 其一大特點是 goroutine 的調度是在用戶態下完成的, 不涉及內核態與用戶態之間的頻繁切換,包括內存的分配與釋放,都是在用戶態維護著一塊大的內存池, 不直接調用系統的 malloc 函數(除非內存池需要改變),成本比調度 OS 線程低很多。 另一方面充分利用了多核的硬件資源,近似的把若干 goroutine 均分在物理線程上, 再加上本身 goroutine 的超輕量,以上種種保證了 go 調度方面的性能。
GOMAXPROCS#
Go 運行時的調度器使用GOMAXPROCS
參數來確定需要使用多少個 OS 線程來同時執行 Go 代碼。默認值是機器上的 CPU 核心數。例如在一個 8 核心的機器上,調度器會把 Go 代碼同時調度到 8 個 OS 線程上(GOMAXPROCS 是 m調度中的 n)。
Go 語言中可以通過runtime.GOMAXPROCS()
函數設置當前程序並發時佔用的 CPU 邏輯核心數。
Go1.5 版本之前,默認使用的是單核心執行。Go1.5 版本之後,默認使用全部的 CPU 邏輯核心數。
我們可以通過將任務分配到不同的 CPU 邏輯核心上實現並行的效果,這裡舉個例子:
func a() {
for i := 1; i < 10; i++ {
fmt.Println("A:", i)
}
}
func b() {
for i := 1; i < 10; i++ {
fmt.Println("B:", i)
}
}
func main() {
runtime.GOMAXPROCS(1)
go a()
go b()
time.Sleep(time.Second)
}
兩個任務只有一個邏輯核心,此時是做完一個任務再做另一個任務。 將邏輯核心數設為 2,此時兩個任務並行執行,代碼如下。
func a() {
for i := 1; i < 10; i++ {
fmt.Println("A:", i)
}
}
func b() {
for i := 1; i < 10; i++ {
fmt.Println("B:", i)
}
}
func main() {
runtime.GOMAXPROCS(2)
go a()
go b()
time.Sleep(time.Second)
}
Go 語言中的操作系統線程和 goroutine 的關係:
- 一個操作系統線程對應用戶態多個 goroutine。
- go 程序可以同時使用多個操作系統線程。
- goroutine 和 OS 線程是多對多的關係,即 m。
channel#
單純地將函數並發執行是沒有意義的。函數與函數間需要交換數據才能體現並發執行函數的意義。
雖然可以使用共享內存進行數據交換,但是共享內存在不同的goroutine
中容易發生競態問題。為了保證數據交換的正確性,必須使用互斥量對內存進行加鎖,這種做法勢必造成性能問題。
Go 語言的並發模型是CSP(Communicating Sequential Processes)
,提倡通過通信共享內存 而不是通過共享內存而實現通信 。
如果說goroutine
是 Go 程序並發的執行體,channel
就是它們之間的連接。channel
是可以讓一個goroutine
發送特定值到另一個goroutine
的通信機制。
Go 語言中的通道(channel)是一種特殊的類型。通道像一個傳送帶或者隊列,總是遵循先入先出(First In First Out)的規則,保證收發數據的順序。每一個通道都是一個具體類型的導管,也就是聲明 channel 的時候需要為其指定元素類型。
channel 類型#
channel
是一種類型,一種引用類型。聲明通道類型的格式如下:
var 變量 chan 元素類型
舉幾個例子:
var ch1 chan int // 聲明一個傳遞整型的通道
var ch2 chan bool // 聲明一個傳遞布爾型的通道
var ch3 chan []int // 聲明一個傳遞int切片的通道
創建 channel#
通道是引用類型,通道類型的空值是nil
。
var ch chan int
fmt.Println(ch) // <nil>
聲明的通道後需要使用make
函數初始化之後才能使用。
創建 channel 的格式如下:
make(chan 元素類型, [緩衝大小])
channel 的緩衝大小是可選的。
舉幾個例子:
ch4 := make(chan int)
ch5 := make(chan bool)
ch6 := make(chan []int)
channel 操作#
通道有發送(send)、接收 (receive)和關閉(close)三種操作。
發送和接收都使用<-
符號。
現在我們先使用以下語句定義一個通道:
ch := make(chan int)
發送#
將一個值發送到通道中。
ch <- 10 // 把10發送到ch中
接收#
從一個通道中接收值。
x := <- ch // 從ch中接收值並賦值給變量x
<-ch // 從ch中接收值,忽略結果
關閉#
我們通過調用內置的close
函數來關閉通道。
close(ch)
關於關閉通道需要注意的事情是,只有在通知接收方 goroutine 所有的數據都發送完畢的時候才需要關閉通道。通道是可以被垃圾回收機制回收的,它和關閉文件是不一樣的,在結束操作之後關閉文件是必須要做的,但關閉通道不是必須的。
關閉後的通道有以下特點:
- 對一個關閉的通道再發送值就會導致 panic。
- 對一個關閉的通道進行接收會一直獲取值直到通道為空。
- 對一個關閉的並且沒有值的通道執行接收操作會得到對應類型的零值。
- 關閉一個已經關閉的通道會導致 panic。
無緩衝的通道#
無緩衝的通道又稱為阻塞的通道。我們來看一下下面的代碼:
func main() {
ch := make(chan int)
ch <- 10
fmt.Println("發送成功")
}
上面這段代碼能夠通過編譯,但是執行的時候會出現以下錯誤:
fatal error: all goroutines are asleep - deadlock!
goroutine 1 [chan send]:
main.main()
.../src/github.com/Q1mi/studygo/day06/channel02/main.go:8 +0x54
為什麼會出現deadlock
錯誤呢?
因為我們使用ch := make(chan int)
創建的是無緩衝的通道,無緩衝的通道只有在有人接收值的時候才能發送值。就像你住的小區沒有快遞櫃和代收點,快遞員給你打電話必須要把這個物品送到你的手中,簡單來說就是無緩衝的通道必須有接收才能發送。
上面的代碼會阻塞在ch <- 10
這一行代碼形成死鎖,那如何解決這個問題呢?
一種方法是啟用一個goroutine
去接收值,例如:
func recv(c chan int) {
ret := <-c
fmt.Println("接收成功", ret)
}
func main() {
ch := make(chan int)
go recv(ch) // 啟用goroutine從通道接收值
ch <- 10
fmt.Println("發送成功")
}
無緩衝通道上的發送操作會阻塞,直到另一個goroutine
在該通道上執行接收操作,這時值才能發送成功,兩個goroutine
將繼續執行。相反,如果接收操作先執行,接收方的 goroutine 將阻塞,直到另一個goroutine
在該通道上發送一個值。
使用無緩衝通道進行通信將導致發送和接收的goroutine
同步化。因此,無緩衝通道也被稱為同步通道
。
有緩衝的通道#
解決上面問題的方法還有一種就是使用有緩衝區的通道。我們可以在使用 make 函數初始化通道的時候為其指定通道的容量,例如:
func main() {
ch := make(chan int, 1) // 創建一個容量為1的有緩衝區通道
ch <- 10
fmt.Println("發送成功")
}
只要通道的容量大於零,那麼該通道就是有緩衝的通道,通道的容量表示通道中能存放元素的數量。就像你小區的快遞櫃只有那麼個多格子,格子滿了就裝不下了,就阻塞了,等到別人取走一個快遞員就能往裡面放一個。
我們可以使用內置的len
函數獲取通道內元素的數量,使用cap
函數獲取通道的容量,雖然我們很少會這麼做。
for range 從通道循環取值#
當向通道中發送完數據時,我們可以通過close
函數來關閉通道。
當通道被關閉時,再往該通道發送值會引發panic
,從該通道取值的操作會先取完通道中的值,再然後取到的值一直都是對應類型的零值。那如何判斷一個通道是否被關閉了呢?
我們來看下面這個例子:
// channel 練習
func main() {
ch1 := make(chan int)
ch2 := make(chan int)
// 開啟goroutine將0~100的數發送到ch1中
go func() {
for i := 0; i < 100; i++ {
ch1 <- i
}
close(ch1)
}()
// 開啟goroutine從ch1中接收值,並將該值的平方發送到ch2中
go func() {
for {
i, ok := <-ch1 // 通道關閉後再取值ok=false
if !ok {
break
}
ch2 <- i * i
}
close(ch2)
}()
// 在主goroutine中從ch2中接收值打印
for i := range ch2 { // 通道關閉後會退出for range循環
fmt.Println(i)
}
}
從上面的例子中我們看到有兩種方式在接收值的時候判斷該通道是否被關閉,不過我們通常使用的是for range
的方式。使用for range
遍歷通道,當通道被關閉的時候就會退出for range
。
單向通道#
有的時候我們會將通道作為參數在多個任務函數間傳遞,很多時候我們在不同的任務函數中使用通道都會對其進行限制,比如限制通道在函數中只能發送或只能接收。
Go 語言中提供了單向通道 來處理這種情況。例如,我們把上面的例子改造如下:
func counter(out chan<- int) {
for i := 0; i < 100; i++ {
out <- i
}
close(out)
}
func squarer(out chan<- int, in <-chan int) {
for i := range in {
out <- i * i
}
close(out)
}
func printer(in <-chan int) {
for i := range in {
fmt.Println(i)
}
}
func main() {
ch1 := make(chan int)
ch2 := make(chan int)
go counter(ch1)
go squarer(ch2, ch1)
printer(ch2)
}
其中,
chan<- int
是一個只寫單向通道(只能對其寫入 int 類型值),可以對其執行發送操作但是不能執行接收操作;<-chan int
是一個只讀單向通道(只能從其讀取 int 類型值),可以對其執行接收操作但是不能執行發送操作。
在函數傳參及任何賦值操作中可以將雙向通道轉換為單向通道,但反過來是不可以的。
通道總結#
channel
常見的異常總結,如下圖:
關閉已經關閉的channel
也會引發panic
。
worker pool(goroutine 池)#
在工作中我們通常會使用可以指定啟動的 goroutine 數量–worker pool
模式,控制goroutine
的數量,防止goroutine
泄漏和暴漲。
一個簡易的work pool
示例代碼如下:
func worker(id int, jobs <-chan int, results chan<- int) {
for j := range jobs {
fmt.Printf("worker:%d start job:%d\n", id, j)
time.Sleep(time.Second)
fmt.Printf("worker:%d end job:%d\n", id, j)
results <- j * 2
}
}
func main() {
jobs := make(chan int, 100)
results := make(chan int, 100)
// 開啟3個goroutine
for w := 1; w <= 3; w++ {
go worker(w, jobs, results)
}
// 5個任務
for j := 1; j <= 5; j++ {
jobs <- j
}
close(jobs)
// 輸出結果
for a := 1; a <= 5; a++ {
<-results
}
}
select 多路復用#
在某些場景下我們需要同時從多個通道接收數據。通道在接收數據時,如果沒有數據可以接收將會發生阻塞。你也許會寫出如下代碼使用遍歷的方式來實現:
for{
// 嘗試從ch1接收值
data, ok := <-ch1
// 嘗試從ch2接收值
data, ok := <-ch2
…
}
這種方式雖然可以實現從多個通道接收值的需求,但是運行性能會差很多。為了應對這種場景,Go 內置了select
關鍵字,可以同時響應多個通道的操作。
select
的使用類似於 switch 語句,它有一系列 case 分支和一個默認的分支。每個 case 會對應一個通道的通信(接收或發送)過程。select
會一直等待,直到某個case
的通信操作完成時,就會執行case
分支對應的語句。具體格式如下:
select{
case <-ch1:
...
case data := <-ch2:
...
case ch3<-data:
...
default:
默認操作
}
舉個小例子來演示下select
的使用:
func main() {
ch := make(chan int, 1)
for i := 0; i < 10; i++ {
select {
case x := <-ch:
fmt.Println(x)
case ch <- i:
}
}
}
使用select
語句能提高代碼的可讀性。
- 可處理一個或多個 channel 的發送 / 接收操作。
- 如果多個
case
同時滿足,select
會隨機選擇一個。 - 對於沒有
case
的select{}
會一直等待,可用於阻塞 main 函數。
並發安全和鎖#
有時候在 Go 代碼中可能會存在多個goroutine
同時操作一個資源(臨界區),這種情況會發生競態問題
(數據競態)。類比現實生活中的例子有十字路口被各個方向的的汽車競爭;還有火車上的衛生間被車廂裡的人競爭。
舉個例子:
var x int64
var wg sync.WaitGroup
func add() {
for i := 0; i < 5000; i++ {
x = x + 1
}
wg.Done()
}
func main() {
wg.Add(2)
go add()
go add()
wg.Wait()
fmt.Println(x)
}
上面的代碼中我們開啟了兩個goroutine
去累加變量 x 的值,這兩個goroutine
在訪問和修改x
變量的時候就會存在數據競爭,導致最後的結果與期待的不符。
互斥鎖#
互斥鎖是一種常用的控制共享資源訪問的方法,它能夠保證同時只有一個goroutine
可以訪問共享資源。Go 語言中使用sync
包的Mutex
類型來實現互斥鎖。 使用互斥鎖來修復上面代碼的問題:
var x int64
var wg sync.WaitGroup
var lock sync.Mutex
func add() {
for i := 0; i < 5000; i++ {
lock.Lock() // 加鎖
x = x + 1
lock.Unlock() // 解鎖
}
wg.Done()
}
func main() {
wg.Add(2)
go add()
go add()
wg.Wait()
fmt.Println(x)
}
使用互斥鎖能夠保證同一時間有且只有一個goroutine
進入臨界區,其他的goroutine
則在等待鎖;當互斥鎖釋放後,等待的goroutine
才可以獲取鎖進入臨界區,多個goroutine
同時等待一個鎖時,喚醒的策略是隨機的。
讀寫互斥鎖#
互斥鎖是完全互斥的,但是有很多實際的場景下是讀多寫少的,當我們並發的去讀取一個資源不涉及資源修改的時候是沒有必要加鎖的,這種場景下使用讀寫鎖是更好的一種選擇。讀寫鎖在 Go 語言中使用sync
包中的RWMutex
類型。
讀寫鎖分為兩種:讀鎖和寫鎖。當一個 goroutine 獲取讀鎖之後,其他的goroutine
如果是獲取讀鎖會繼續獲得鎖,如果是獲取寫鎖就會等待;當一個goroutine
獲取寫鎖之後,其他的goroutine
無論是獲取讀鎖還是寫鎖都會等待。
讀寫鎖示例:
var (
x int64
wg sync.WaitGroup
lock sync.Mutex
rwlock sync.RWMutex
)
func write() {
// lock.Lock() // 加互斥鎖
rwlock.Lock() // 加寫鎖
x = x + 1
time.Sleep(10 * time.Millisecond) // 假設讀操作耗時10毫秒
rwlock.Unlock() // 解寫鎖
// lock.Unlock() // 解互斥鎖
wg.Done()
}
func read() {
// lock.Lock() // 加互斥鎖
rwlock.RLock() // 加讀鎖
time.Sleep(time.Millisecond) // 假設讀操作耗時1毫秒
rwlock.RUnlock() // 解讀鎖
// lock.Unlock() // 解互斥鎖
wg.Done()
}
func main() {
start := time.Now()
for i := 0; i < 10; i++ {
wg.Add(1)
go write()
}
for i := 0; i < 1000; i++ {
wg.Add(1)
go read()
}
wg.Wait()
end := time.Now()
fmt.Println(end.Sub(start))
}
需要注意的是讀寫鎖非常適合讀多寫少的場景,如果讀和寫的操作差別不大,讀寫鎖的優勢就發揮不出來。
sync.WaitGroup#
在代碼中生硬的使用time.Sleep
肯定是不合適的,Go 語言中可以使用sync.WaitGroup
來實現並發任務的同步。 sync.WaitGroup
有以下幾個方法:
方法名 | 功能 |
---|---|
(wg * WaitGroup) Add(delta int) | 計數器 + delta |
(wg *WaitGroup) Done() | 計數器 - 1 |
(wg *WaitGroup) Wait() | 阻塞直到計數器變為 0 |
sync.WaitGroup
內部維護著一個計數器,計數器的值可以增加和減少。例如當我們啟動了 N 個並發任務時,就將計數器值增加 N。每個任務完成時通過調用 Done () 方法將計數器減 1。通過調用 Wait () 來等待並發任務執行完,當計數器值為 0 時,表示所有並發任務已經完成。
我們利用sync.WaitGroup
將上面的代碼優化一下:
var wg sync.WaitGroup
func hello() {
defer wg.Done()
fmt.Println("Hello Goroutine!")
}
func main() {
wg.Add(1)
go hello() // 啟動另外一個goroutine去執行hello函數
fmt.Println("main goroutine done!")
wg.Wait()
}
需要注意sync.WaitGroup
是一個構造體,傳遞的時候要傳遞指針。
sync.Once#
說在前面話:這是一個進階知識點。
在編程的很多場景下我們需要確保某些操作在高並發的場景下只執行一次,例如只加載一次配置文件、只關閉一次通道等。
Go 語言中的sync
包中提供了一個針對只執行一次場景的解決方案–sync.Once
。
sync.Once
只有一個Do
方法,其簽名如下:
func (o *Once) Do(f func()) {}
備註:如果要執行的函數f
需要傳遞參數就需要搭配閉包來使用。
加載配置文件示例#
延遲一個開銷很大的初始化操作到真正用到它的時候再執行是一個很好的實踐。因為預先初始化一個變量(比如在 init 函數中完成初始化)會增加程序的啟動耗時,而且有可能實際執行過程中這個變量沒有用上,那麼這個初始化操作就不是必須要做的。我們來看一個例子:
var icons map[string]image.Image
func loadIcons() {
icons = map[string]image.Image{
"left": loadIcon("left.png"),
"up": loadIcon("up.png"),
"right": loadIcon("right.png"),
"down": loadIcon("down.png"),
}
}
// Icon 被多個goroutine調用時不是並發安全的
func Icon(name string) image.Image {
if icons == nil {
loadIcons()
}
return icons[name]
}
多個goroutine
並發調用 Icon 函數時不是並發安全的,現代的編譯器和 CPU 可能會在保證每個goroutine
都滿足串行一致的基礎上自由地重排訪問內存的順序。loadIcons 函數可能會被重排為以下結果:
func loadIcons() {
icons = make(map[string]image.Image)
icons["left"] = loadIcon("left.png")
icons["up"] = loadIcon("up.png")
icons["right"] = loadIcon("right.png")
icons["down"] = loadIcon("down.png")
}
在這種情況下就會出現即使判斷了icons
不是 nil 也不意味著變量初始化完成了。考慮到這種情況,我們能想到的辦法就是添加互斥鎖,保證初始化icons
的時候不會被其他的goroutine
操作,但是這樣做又會引發性能問題。
使用sync.Once
改造的示例代碼如下:
var icons map[string]image.Image
var loadIconsOnce sync.Once
func loadIcons() {
icons = map[string]image.Image{
"left": loadIcon("left.png"),
"up": loadIcon("up.png"),
"right": loadIcon("right.png"),
"down": loadIcon("down.png"),
}
}
// Icon 是並發安全的
func Icon(name string) image.Image {
loadIconsOnce.Do(loadIcons)
return icons[name]
}
並發安全的單例模式#
下面是借助sync.Once
實現的並發安全的單例模式:
package singleton
import (
"sync"
)
type singleton struct {}
var instance *singleton
var once sync.Once
func GetInstance() *singleton {
once.Do(func() {
instance = &singleton{}
})
return instance
}
sync.Once
其實內部包含一個互斥鎖和一個布爾值,互斥鎖保證布爾值和數據的安全,而布爾值用來記錄初始化是否完成。這樣設計就能保證初始化操作的時候是並發安全的並且初始化操作也不會被執行多次。
sync.Map#
Go 語言中內置的 map 不是並發安全的。請看下面的示例:
var m = make(map[string]int)
func get(key string) int {
return m[key]
}
func set(key string, value int) {
m[key] = value
}
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 20; i++ {
wg.Add(1)
go func(n int) {
key := strconv.Itoa(n)
set(key, n)
fmt.Printf("k=:%v,v:=%v\n", key, get(key))
wg.Done()
}(i)
}
wg.Wait()
}
上面的代碼開啟少量幾個goroutine
的時候可能沒什麼問題,當並發多了之後執行上面的代碼就會報fatal error: concurrent map writes
錯誤。
像這種場景下就需要為 map 加鎖來保證並發的安全性了,Go 語言的sync
包中提供了一個開箱即用的並發安全版 map–sync.Map
。開箱即用表示不用像內置的 map 一樣使用 make 函數初始化就能直接使用。同時sync.Map
內置了諸如Store
、Load
、LoadOrStore
、Delete
、Range
等操作方法。
var m = sync.Map{}
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 20; i++ {
wg.Add(1)
go func(n int) {
key := strconv.Itoa(n)
m.Store(key, n)
value, _ := m.Load(key)
fmt.Printf("k=:%v,v:=%v\n", key, value)
wg.Done()
}(i)
}
wg.Wait()
}
原子操作#
在上面的代碼中的我們通過鎖操作來實現同步。而鎖機制的底層是基於原子操作的,其一般直接通過 CPU 指令實現。Go 語言中原子操作由內置的標準庫sync/atomic
提供。
atomic 包#
方法 | 解釋 |
---|---|
func LoadInt32(addr *int32) (val int32) | |
func LoadInt64(addr *int64) (val int64) | |
func LoadUint32(addr *uint32) (val uint32) | |
func LoadUint64(addr *uint64) (val uint64) | |
func LoadUintptr(addr *uintptr) (val uintptr) | |
func LoadPointer(addr *unsafe.Pointer) (val unsafe.Pointer) | 讀取操作 |
func StoreInt32(addr *int32, val int32) | |
func StoreInt64(addr *int64, val int64) | |
func StoreUint32(addr *uint32, val uint32) | |
func StoreUint64(addr *uint64, val uint64) | |
func StoreUintptr(addr *uintptr, val uintptr) | |
func StorePointer(addr *unsafe.Pointer, val unsafe.Pointer) | 寫入操作 |
func AddInt32(addr *int32, delta int32) (new int32) | |
func AddInt64(addr *int64, delta int64) (new int64) | |
func AddUint32(addr *uint32, delta uint32) (new uint32) | |
func AddUint64(addr *uint64, delta uint64) (new uint64) | |
func AddUintptr(addr *uintptr, delta uintptr) (new uintptr) | 修改操作 |
func SwapInt32(addr *int32, new int32) (old int32) | |
func SwapInt64(addr *int64, new int64) (old int64) | |
func SwapUint32(addr *uint32, new uint32) (old uint32) | |
func SwapUint64(addr *uint64, new uint64) (old uint64) | |
func SwapUintptr(addr *uintptr, new uintptr) (old uintptr) | |
func SwapPointer(addr *unsafe.Pointer, new unsafe.Pointer) | 交換操作 |
func CompareAndSwapInt32(addr *int32, old, new int32) (swapped bool) | |
func CompareAndSwapInt64(addr *int64, old, new int64) (swapped bool) | |
func CompareAndSwapUint32(addr *uint32, old, new uint32) (swapped bool) | |
func CompareAndSwapUint64(addr *uint64, old, new uint64) (swapped bool) | |
func CompareAndSwapUintptr(addr *uintptr, old, new uintptr) (swapped bool) | |
func CompareAndSwapPointer(addr *unsafe.Pointer, old, new unsafe.Pointer) (swapped bool) | 比較並交換操作 |
示例#
我們填寫一個示例來比較下互斥鎖和原子操作的性能。
package main
import (
"fmt"
"sync"
"sync/atomic"
"time"
)
type Counter interface {
Inc()
Load() int64
}
// 普通版
type CommonCounter struct {
counter int64
}
func (c CommonCounter) Inc() {
c.counter++
}
func (c CommonCounter) Load() int64 {
return c.counter
}
// 互斥鎖版
type MutexCounter struct {
counter int64
lock sync.Mutex
}
func (m *MutexCounter) Inc() {
m.lock.Lock()
defer m.lock.Unlock()
m.counter++
}
func (m *MutexCounter) Load() int64 {
m.lock.Lock()
defer m.lock.Unlock()
return m.counter
}
// 原子操作版
type AtomicCounter struct {
counter int64
}
func (a *AtomicCounter) Inc() {
atomic.AddInt64(&a.counter, 1)
}
func (a *AtomicCounter) Load() int64 {
return atomic.LoadInt64(&a.counter)
}
func test(c Counter) {
var wg sync.WaitGroup
start := time.Now()
for i := 0; i < 1000; i++ {
wg.Add(1)
go func() {
c.Inc()
wg.Done()
}()
}
wg.Wait()
end := time.Now()
fmt.Println(c.Load(), end.Sub(start))
}
func main() {
c1 := CommonCounter{} // 非並發安全
test(c1)
c2 := MutexCounter{} // 使用互斥鎖實現並發安全
test(&c2)
c3 := AtomicCounter{} // 並發安全且比互斥鎖效率更高
test(&c3)
}
atomic
包提供了底層的原子級內存操作,對於同步算法的實現很有用。這些函數必須謹慎地保證正確使用。除了某些特殊的底層應用,使用通道或者 sync 包的函數 / 類型實現同步更好。
練習題#
- 使用
goroutine
和channel
實現一個計算 int64 隨機數各位數和的程序。- 開啟一個
goroutine
循環生成 int64 類型的隨機數,發送到jobChan
- 開啟 24 個
goroutine
從jobChan
中取出隨機數計算各位數的和,將結果發送到resultChan
- 主
goroutine
從resultChan
取出結果並打印到終端輸出
- 開啟一個
- 為了保證業務代碼的執行性能將之前寫的日誌庫改寫為異步記錄日誌方式。