原文鏈接:https://gopl-zh.github.io/ch5/ch5-04.html
在Go中有一部分函數(shù)總是能成功的運(yùn)行。比如strings.Contains和strconv.FormatBool函數(shù),對(duì)各種可能的輸入都做了良好的處理,使得運(yùn)行時(shí)幾乎不會(huì)失敗,除非遇到災(zāi)難性的、不可預(yù)料的情況,比如運(yùn)行時(shí)的內(nèi)存溢出。導(dǎo)致這種錯(cuò)誤的原因很復(fù)雜,難以處理,從錯(cuò)誤中恢復(fù)的可能性也很低。
還有一部分函數(shù)只要輸入的參數(shù)滿足一定條件,也能保證運(yùn)行成功。比如time.Date函數(shù),該函數(shù)將年月日等參數(shù)構(gòu)造成time.Time對(duì)象,除非最后一個(gè)參數(shù)(時(shí)區(qū))是nil。這種情況下會(huì)引發(fā)panic異常。panic是來自被調(diào)用函數(shù)的信號(hào),表示發(fā)生了某個(gè)已知的bug。一個(gè)良好的程序永遠(yuǎn)不應(yīng)該發(fā)生panic異常。
對(duì)于大部分函數(shù)而言,永遠(yuǎn)無法確保能否成功運(yùn)行。這是因?yàn)殄e(cuò)誤的原因超出了程序員的控制。舉個(gè)例子,任何進(jìn)行I/O操作的函數(shù)都會(huì)面臨出現(xiàn)錯(cuò)誤的可能,只有沒有經(jīng)驗(yàn)的程序員才會(huì)相信讀寫操作不會(huì)失敗,即使是簡(jiǎn)單的讀寫。因此,當(dāng)本該可信的操作出乎意料的失敗后,我們必須弄清楚導(dǎo)致失敗的原因。
在Go的錯(cuò)誤處理中,錯(cuò)誤是軟件包API和應(yīng)用程序用戶界面的一個(gè)重要組成部分,程序運(yùn)行失敗僅被認(rèn)為是幾個(gè)預(yù)期的結(jié)果之一。
對(duì)于那些將運(yùn)行失敗看作是預(yù)期結(jié)果的函數(shù),它們會(huì)返回一個(gè)額外的返回值,通常是最后一個(gè),來傳遞錯(cuò)誤信息。如果導(dǎo)致失敗的原因只有一個(gè),額外的返回值可以是一個(gè)布爾值,通常被命名為ok。比如,cache.Lookup失敗的唯一原因是key不存在,那么代碼可以按照下面的方式組織:
value, ok := cache.Lookup(key)
if !ok {
// ...cache[key] does not exist…
}
通常,導(dǎo)致失敗的原因不止一種,尤其是對(duì)I/O操作而言,用戶需要了解更多的錯(cuò)誤信息。因此,額外的返回值不再是簡(jiǎn)單的布爾類型,而是error類型。
內(nèi)置的error是接口類型。我們將在第七章了解接口類型的含義,以及它對(duì)錯(cuò)誤處理的影響。現(xiàn)在我們只需要明白error類型可能是nil或者non-nil。nil意味著函數(shù)運(yùn)行成功,non-nil表示失敗。對(duì)于non-nil的error類型,我們可以通過調(diào)用error的Error函數(shù)或者輸出函數(shù)獲得字符串類型的錯(cuò)誤信息。
fmt.Println(err)
fmt.Printf("%v", err)
通常,當(dāng)函數(shù)返回non-nil的error時(shí),其他的返回值是未定義的(undefined),這些未定義的返回值應(yīng)該被忽略。然而,有少部分函數(shù)在發(fā)生錯(cuò)誤時(shí),仍然會(huì)返回一些有用的返回值。比如,當(dāng)讀取文件發(fā)生錯(cuò)誤時(shí),Read函數(shù)會(huì)返回可以讀取的字節(jié)數(shù)以及錯(cuò)誤信息。對(duì)于這種情況,正確的處理方式應(yīng)該是先處理這些不完整的數(shù)據(jù),再處理錯(cuò)誤。因此對(duì)函數(shù)的返回值要有清晰的說明,以便于其他人使用。
在Go中,函數(shù)運(yùn)行失敗時(shí)會(huì)返回錯(cuò)誤信息,這些錯(cuò)誤信息被認(rèn)為是一種預(yù)期的值而非異常(exception),這使得Go有別于那些將函數(shù)運(yùn)行失敗看作是異常的語言。雖然Go有各種異常機(jī)制,但這些機(jī)制僅被使用在處理那些未被預(yù)料到的錯(cuò)誤,即bug,而不是那些在健壯程序中應(yīng)該被避免的程序錯(cuò)誤。對(duì)于Go的異常機(jī)制我們將在5.9介紹。
Go這樣設(shè)計(jì)的原因是由于對(duì)于某個(gè)應(yīng)該在控制流程中處理的錯(cuò)誤而言,將這個(gè)錯(cuò)誤以異常的形式拋出會(huì)混亂對(duì)錯(cuò)誤的描述,這通常會(huì)導(dǎo)致一些糟糕的后果。當(dāng)某個(gè)程序錯(cuò)誤被當(dāng)作異常處理后,這個(gè)錯(cuò)誤會(huì)將堆棧跟蹤信息返回給終端用戶,這些信息復(fù)雜且無用,無法幫助定位錯(cuò)誤。
正因此,Go使用控制流機(jī)制(如if和return)處理錯(cuò)誤,這使得編碼人員能更多的關(guān)注錯(cuò)誤處理。
當(dāng)一次函數(shù)調(diào)用返回錯(cuò)誤時(shí),調(diào)用者應(yīng)該選擇合適的方式處理錯(cuò)誤。根據(jù)情況的不同,有很多處理方式,讓我們來看看常用的五種方式。
首先,也是最常用的方式是傳播錯(cuò)誤。這意味著函數(shù)中某個(gè)子程序的失敗,會(huì)變成該函數(shù)的失敗。下面,我們以5.3節(jié)的findLinks函數(shù)作為例子。如果findLinks對(duì)http.Get的調(diào)用失敗,findLinks會(huì)直接將這個(gè)HTTP錯(cuò)誤返回給調(diào)用者:
resp, err := http.Get(url)
if err != nil{
return nil, err
}
當(dāng)對(duì)html.Parse的調(diào)用失敗時(shí),findLinks不會(huì)直接返回html.Parse的錯(cuò)誤,因?yàn)槿鄙賰蓷l重要信息:1、發(fā)生錯(cuò)誤時(shí)的解析器(html parser);2、發(fā)生錯(cuò)誤的url。因此,findLinks構(gòu)造了一個(gè)新的錯(cuò)誤信息,既包含了這兩項(xiàng),也包括了底層的解析出錯(cuò)的信息。
doc, err := html.Parse(resp.Body)
resp.Body.Close()
if err != nil {
return nil, fmt.Errorf("parsing %s as HTML: %v", url,err)
}
fmt.Errorf函數(shù)使用fmt.Sprintf格式化錯(cuò)誤信息并返回。我們使用該函數(shù)添加額外的前綴上下文信息到原始錯(cuò)誤信息。當(dāng)錯(cuò)誤最終由main函數(shù)處理時(shí),錯(cuò)誤信息應(yīng)提供清晰的從原因到后果的因果鏈,就像美國(guó)宇航局事故調(diào)查時(shí)做的那樣:
genesis: crashed: no parachute: G-switch failed: bad relay orientation
由于錯(cuò)誤信息經(jīng)常是以鏈?zhǔn)浇M合在一起的,所以錯(cuò)誤信息中應(yīng)避免大寫和換行符。最終的錯(cuò)誤信息可能很長(zhǎng),我們可以通過類似grep的工具處理錯(cuò)誤信息(譯者注:grep是一種文本搜索工具)。
編寫錯(cuò)誤信息時(shí),我們要確保錯(cuò)誤信息對(duì)問題細(xì)節(jié)的描述是詳盡的。尤其是要注意錯(cuò)誤信息表達(dá)的一致性,即相同的函數(shù)或同包內(nèi)的同一組函數(shù)返回的錯(cuò)誤在構(gòu)成和處理方式上是相似的。
以os包為例,os包確保文件操作(如os.Open、Read、Write、Close)返回的每個(gè)錯(cuò)誤的描述不僅僅包含錯(cuò)誤的原因(如無權(quán)限,文件目錄不存在)也包含文件名,這樣調(diào)用者在構(gòu)造新的錯(cuò)誤信息時(shí)無需再添加這些信息。
一般而言,被調(diào)用函數(shù)f(x)會(huì)將調(diào)用信息和參數(shù)信息作為發(fā)生錯(cuò)誤時(shí)的上下文放在錯(cuò)誤信息中并返回給調(diào)用者,調(diào)用者需要添加一些錯(cuò)誤信息中不包含的信息,比如添加url到html.Parse返回的錯(cuò)誤中。
讓我們來看看處理錯(cuò)誤的第二種策略。如果錯(cuò)誤的發(fā)生是偶然性的,或由不可預(yù)知的問題導(dǎo)致的。一個(gè)明智的選擇是重新嘗試失敗的操作。在重試時(shí),我們需要限制重試的時(shí)間間隔或重試的次數(shù),防止無限制的重試。
gopl.io/ch5/wait
// WaitForServer attempts to contact the server of a URL.
// It tries for one minute using exponential back-off.
// It reports an error if all attempts fail.
func WaitForServer(url string) error {
const timeout = 1 * time.Minute
deadline := time.Now().Add(timeout)
for tries := 0; time.Now().Before(deadline); tries++ {
_, err := http.Head(url)
if err == nil {
return nil // success
}
log.Printf("server not responding (%s);retrying…", err)
time.Sleep(time.Second << uint(tries)) // exponential back-off
}
return fmt.Errorf("server %s failed to respond after %s", url, timeout)
}
如果錯(cuò)誤發(fā)生后,程序無法繼續(xù)運(yùn)行,我們就可以采用第三種策略:輸出錯(cuò)誤信息并結(jié)束程序。需要注意的是,這種策略只應(yīng)在main中執(zhí)行。對(duì)庫(kù)函數(shù)而言,應(yīng)僅向上傳播錯(cuò)誤,除非該錯(cuò)誤意味著程序內(nèi)部包含不一致性,即遇到了bug,才能在庫(kù)函數(shù)中結(jié)束程序。
// (In function main.)
if err := WaitForServer(url); err != nil {
fmt.Fprintf(os.Stderr, "Site is down: %v\n", err)
os.Exit(1)
}
調(diào)用log.Fatalf可以更簡(jiǎn)潔的代碼達(dá)到與上文相同的效果。log中的所有函數(shù),都默認(rèn)會(huì)在錯(cuò)誤信息之前輸出時(shí)間信息。
if err := WaitForServer(url); err != nil {
log.Fatalf("Site is down: %v\n", err)
}
長(zhǎng)時(shí)間運(yùn)行的服務(wù)器常采用默認(rèn)的時(shí)間格式,而交互式工具很少采用包含如此多信息的格式。
2006/01/02 15:04:05 Site is down: no such domain:
bad.gopl.io
我們可以設(shè)置log的前綴信息屏蔽時(shí)間信息,一般而言,前綴信息會(huì)被設(shè)置成命令名。
log.SetPrefix("wait: ")
log.SetFlags(0)
第四種策略:有時(shí),我們只需要輸出錯(cuò)誤信息就足夠了,不需要中斷程序的運(yùn)行。我們可以通過log包提供函數(shù)
if err := Ping(); err != nil {
log.Printf("ping failed: %v; networking disabled",err)
}
或者標(biāo)準(zhǔn)錯(cuò)誤流輸出錯(cuò)誤信息。
if err := Ping(); err != nil {
fmt.Fprintf(os.Stderr, "ping failed: %v; networking disabled\n", err)
}
log包中的所有函數(shù)會(huì)為沒有換行符的字符串增加換行符。
第五種,也是最后一種策略:我們可以直接忽略掉錯(cuò)誤。
dir, err := ioutil.TempDir("", "scratch")
if err != nil {
return fmt.Errorf("failed to create temp dir: %v",err)
}
// ...use temp dir…
os.RemoveAll(dir) // ignore errors; $TMPDIR is cleaned periodically
盡管os.RemoveAll會(huì)失敗,但上面的例子并沒有做錯(cuò)誤處理。這是因?yàn)椴僮飨到y(tǒng)會(huì)定期的清理臨時(shí)目錄。正因如此,雖然程序沒有處理錯(cuò)誤,但程序的邏輯不會(huì)因此受到影響。我們應(yīng)該在每次函數(shù)調(diào)用后,都養(yǎng)成考慮錯(cuò)誤處理的習(xí)慣,當(dāng)你決定忽略某個(gè)錯(cuò)誤時(shí),你應(yīng)該清晰地寫下你的意圖。
在Go中,錯(cuò)誤處理有一套獨(dú)特的編碼風(fēng)格。檢查某個(gè)子函數(shù)是否失敗后,我們通常將處理失敗的邏輯代碼放在處理成功的代碼之前。如果某個(gè)錯(cuò)誤會(huì)導(dǎo)致函數(shù)返回,那么成功時(shí)的邏輯代碼不應(yīng)放在else語句塊中,而應(yīng)直接放在函數(shù)體中。Go中大部分函數(shù)的代碼結(jié)構(gòu)幾乎相同,首先是一系列的初始檢查,防止錯(cuò)誤發(fā)生,之后是函數(shù)的實(shí)際邏輯。
函數(shù)經(jīng)常會(huì)返回多種錯(cuò)誤,這對(duì)終端用戶來說可能會(huì)很有趣,但對(duì)程序而言,這使得情況變得復(fù)雜。很多時(shí)候,程序必須根據(jù)錯(cuò)誤類型,作出不同的響應(yīng)。讓我們考慮這樣一個(gè)例子:從文件中讀取n個(gè)字節(jié)。如果n等于文件的長(zhǎng)度,讀取過程的任何錯(cuò)誤都表示失敗。如果n小于文件的長(zhǎng)度,調(diào)用者會(huì)重復(fù)的讀取固定大小的數(shù)據(jù)直到文件結(jié)束。這會(huì)導(dǎo)致調(diào)用者必須分別處理由文件結(jié)束引起的各種錯(cuò)誤?;谶@樣的原因,io包保證任何由文件結(jié)束引起的讀取失敗都返回同一個(gè)錯(cuò)誤——io.EOF,該錯(cuò)誤在io包中定義:
package io
import "errors"
// EOF is the error returned by Read when no more input is available.
var EOF = errors.New("EOF")
調(diào)用者只需通過簡(jiǎn)單的比較,就可以檢測(cè)出這個(gè)錯(cuò)誤。下面的例子展示了如何從標(biāo)準(zhǔn)輸入中讀取字符,以及判斷文件結(jié)束。(4.3的chartcount程序展示了更加復(fù)雜的代碼)
in := bufio.NewReader(os.Stdin)
for {
r, _, err := in.ReadRune()
if err == io.EOF {
break // finished reading
}
if err != nil {
return fmt.Errorf("read failed:%v", err)
}
// ...use r…
}
因?yàn)槲募Y(jié)束這種錯(cuò)誤不需要更多的描述,所以io.EOF有固定的錯(cuò)誤信息——“EOF”。對(duì)于其他錯(cuò)誤,我們可能需要在錯(cuò)誤信息中描述錯(cuò)誤的類型和數(shù)量,這使得我們不能像io.EOF一樣采用固定的錯(cuò)誤信息。在7.11節(jié)中,我們會(huì)提出更系統(tǒng)的方法區(qū)分某些固定的錯(cuò)誤值。
更多建議: