如何閱讀《深入理解計算機系統(tǒng)》?(文末送書)
導(dǎo)讀:如果你也讀CS專業(yè),如果你也不知道怎么回答“學(xué)計算機不就是學(xué)修電腦”這個CS系的宿命之問,推薦一定讀一讀《深入理解計算機系統(tǒng)》。《深入理解計算機系統(tǒng)》是一本什么樣的書呢?兩個字,經(jīng)典。原因有二,第一,這書無數(shù)業(yè)界大牛推薦,第二,這書和你印象中的經(jīng)典一樣,給人的第一感覺就是厚實。不過,厚實也很容易再給人一種感覺,那就是望而卻步——你沒準(zhǔn)會想,這么厚的書,又是經(jīng)典,是不是很難讀?
大可放心,一點也不會。
經(jīng)典也是有細分領(lǐng)域的,有很多書之所以經(jīng)典,是因為對一些問題進行了很深入的探討,而《深入理解計算機系統(tǒng)》的經(jīng)典,我認(rèn)為是把計算機中被分割成很多塊的知識,用一本書一口氣完整地全部整理出來。
1《深入理解計算機系統(tǒng)》為什么經(jīng)典
我們先回想一下,計算機專業(yè)都開設(shè)有哪些專業(yè)課。首先肯定有編程,這個專業(yè)很大一部分工作是要給碼農(nóng)培養(yǎng)接班人。編程的一個重要環(huán)節(jié)是編譯,那設(shè)計編譯器要開一門課,叫編譯原理。編譯完了要運行,運行需要依賴硬件環(huán)境和軟件環(huán)境,于是就有了計算機組成原理和操作系統(tǒng)。如果早個二三十年,計算機的知識體系到這就差不多了,不過現(xiàn)在可是網(wǎng)絡(luò)時代,所以還得再加一門課,叫計算機網(wǎng)絡(luò)。這還是往大了分,細分就更多了,光編程語言就有好幾種,而且別忘了背后還有一堆的各種數(shù)學(xué),就不細說了。
計算機技術(shù)蓬勃發(fā)展,學(xué)科體系自然枝繁葉茂,但學(xué)計算機很容易就像在追冰與火之歌一樣,世界觀太宏大支線劇情太多,眼前很難呈現(xiàn)出一幅完整的圖景。所以當(dāng)時我們學(xué)各門學(xué)科的時候,大家問的最多的不是學(xué)科本身的某個知識點,而是“為什么要學(xué)這門課”。剛才我把各個主要科目串了一串,讀完應(yīng)該會對各科之間的關(guān)系有一個更宏觀的了解。
可是,光有這么一句話肯定還有很多問題沒法解決。有沒有一本書專從這個角度講計算機科學(xué)呢?計算機科學(xué)有很多經(jīng)典的書,但大多數(shù)都是專注各個領(lǐng)域的內(nèi)部知識,不過好在還真有一本經(jīng)典的書,是從計算機的角度來看待計算機,這就是《深入理解計算機系統(tǒng)》。
我當(dāng)初讀《深入理解計算機系統(tǒng)》,讀完就是一個感覺,淋漓暢快。感覺腦子里很多零星的碎片,讀完以后都拼在了一起?!渡钊肜斫庥嬎銠C系統(tǒng)》書很厚,講的也深入,但深入的是知識點與知識點之間的關(guān)聯(lián),也許很多正好都是你深感困擾的問題,讀完很容易讓你有種“哦,原來是這樣”的感嘆,節(jié)省了很多去苦苦思索的時間。寫本文的時候我特意看了一下大家對《深入理解計算機系統(tǒng)》的書評,果然很多人感受和我一樣,相見恨晚。
2《深入理解計算機系統(tǒng)》都寫了什么
《深入理解計算機系統(tǒng)》這本書起源于卡內(nèi)基梅隆大學(xué)(CMU)的一門課,叫計算機系統(tǒng)導(dǎo)論(ICS)。這門課相信計算機系的學(xué)生都不會陌生,一般都是作為第一門專業(yè)課開設(shè)的,內(nèi)容基本就是回答大家剛?cè)肟訒r最想知道的那個問題:學(xué)計算機都學(xué)些什么。對于我來說,這是當(dāng)時唯一一門從計算機整體視角來開展介紹的課程,在那以后,我們就被扔進各個子學(xué)科里面撲騰,再也難一窺全貌。
《深入理解計算機系統(tǒng)》的作者們很謙虛,說這本書起源于ICS,但經(jīng)過3版的不斷擴充內(nèi)容,涵蓋范圍已經(jīng)很廣,現(xiàn)在也可以作為計算機組成原理(ORG)和系統(tǒng)編程(SP)的教材,但我覺得,這本書的用途遠不止于“教材”。
相信每個學(xué)完計算機的學(xué)生都會認(rèn)同,學(xué)計算機,編程也好其它什么也好,最佳的方法就是動手,親自動手做一次,比看什么書都掌握得牢靠。但是,這就帶來一個悖論:學(xué)計算機,最好的方法就是去做一臺計算機,計算機專業(yè)教的內(nèi)容一言蔽之,確實就是怎樣去制造計算機運行的各個所需部件,但限制條件非常多,真正動手?jǐn)]一臺計算機不太現(xiàn)實。
那怎么辦呢?我經(jīng)常在B站圍觀大牛完成各種精巧的小玩意,看了一遍,感覺自己也像是做了一遍,雖然肯定沒有自己動手來得實在,不過肯定比只看純描寫要好得多。那我們是不是能退而求其次,“看”別人一個部件一個部件地擼一臺計算機呢?《深入理解計算機系統(tǒng)》就是從這個理念出發(fā)寫成了本書。
3《深入理解計算機系統(tǒng)》第3版都改了什么
《深入理解計算機系統(tǒng)》是一本經(jīng)典書,現(xiàn)在已經(jīng)出到了第3版,正好我手里第2版和第3版都有,順手先一個比較。
總的來說,第3版基本沿用了第2版的框架,但也有不少變化。首先第3版有兩個直觀變化,一個是更厚了一點,一個是印刷更好看了,第2版是最經(jīng)典的黑白印刷,第3版加入了藍色,正好這本書里面很多代碼圖表,看起來更醒目了。
在內(nèi)容上第3版也做了大量修改。第2版和第3版大概相差10年,在第2版上市的時候,IA32架構(gòu),也就是我們俗稱的32位指令集還是主流,但到了現(xiàn)在,已經(jīng)是64位指令集,也就是x86-64的天下了。第3版也體現(xiàn)了技術(shù)的變化,指令集的表現(xiàn)形式均采用64位。指令集是非常底層的東西,所以這部分牽涉了很多內(nèi)容,書里都做了全面調(diào)整。
另一個內(nèi)容上的大改動是API的升級,譬如在第11章,第3版用新的getaddrinfo和getnameinfo函數(shù)取代了老版的gethostbyname和gethostbyaddr。
此外還有不少細節(jié)上的調(diào)整甚至重寫,也對一些容易讓人困擾的知識點進行了擴充說明,總的來說閱讀體驗比上一版更好。4《深入理解計算機系統(tǒng)》漫游指南
《深入理解計算機系統(tǒng)》一共12章,分成程序結(jié)構(gòu)和執(zhí)行、在系統(tǒng)上運行程序和程序間的交互和通信三個部分,涉及了計算機技術(shù)的方方面面,橫跨多個科目。下面我就毛遂自薦充當(dāng)各位的導(dǎo)游,和大家一起逐章看看都講了哪些內(nèi)容。
第一章,章名就叫“計算機系統(tǒng)漫游”,可以認(rèn)為是這本書的“計算機導(dǎo)論”課,以一個hello程序為主線,串起了從編代碼到程序執(zhí)行整個過程都經(jīng)歷了哪些環(huán)節(jié)。最后有一個知識點,叫“Amdahl定律”,研究各個部件的性能提升和整體性能提升的關(guān)系。
第二章,叫“信息的表示和處理”,介紹了一些數(shù)字邏輯的內(nèi)容,也就是計算機的“計算”部分。計算可分為數(shù)值類型和運算類型兩個組成部分,在數(shù)學(xué)體系里,數(shù)的類型有很多,譬如自然數(shù)、整數(shù)、有理數(shù)、無理數(shù)、代數(shù)數(shù)、超越數(shù)、實數(shù)等等,光數(shù)系都是數(shù)學(xué)里的重點研究對象,不過別擔(dān)心,計算機里邊就簡單多了,目前只分為整數(shù)和浮點數(shù)兩類。第二章也是“程序結(jié)構(gòu)和執(zhí)行”部分的第一章,往下都是從機器角度看程序構(gòu)造。
第三章,叫“程序的機器級表示”,名字挺拗口,其實說的就是指令集的事。計算機專業(yè)一般不會為CPU指令集專門開一課,很多知識點和匯編語言說的內(nèi)容重合,前面說的全面調(diào)整為x86-64體系,在這個部分體現(xiàn)得很充分。
第四章,叫“處理器體系結(jié)構(gòu)”,講的是CPU的工作原理。不要和上一章搞混了,CPU的指令集,和CPU本身的結(jié)構(gòu)原理有關(guān)系,但不完全是一回事,這一章更多的是邏輯電路相關(guān)的內(nèi)容,介紹諸如時鐘周期、流水線等偏硬件內(nèi)容。
第五章,叫“優(yōu)化程序性能”,章名就已經(jīng)很明確,劃分知識點的話大部分屬于編譯原理范疇。我們上編譯原理主要講的是各種文法和實現(xiàn)諸如詞法器這類的部件,不過這都屬于基本功,真正的重點和難點在于優(yōu)化。當(dāng)然程序性能優(yōu)化不止編譯優(yōu)化,這是一套體系,還有內(nèi)存、存儲等多個地方都可以進行優(yōu)化。要想看編譯原理的基本功部分,推薦看龍書。
第六章,叫“存儲器層次結(jié)構(gòu)”,就是我們所說的內(nèi)存外存了,涉及磁盤構(gòu)造、緩存設(shè)計等等問題。
第七章,叫“鏈接”,這是源碼編譯的一個重要環(huán)節(jié)?;貞浺幌戮幾g原理對編譯過程的介紹,源碼編譯不是直接從源碼編譯成目標(biāo)代碼,也就是不是直接生成機器碼,而生成一種叫“中間代碼”的產(chǎn)物。以中間代碼為界,前面叫“前端”,對應(yīng)的還有一個“后端”,就是通過中間代碼最終生成目標(biāo)代碼,鏈接就是這個過程的一個重要環(huán)節(jié)。第七章也是“在系統(tǒng)上運行程序”部分的第一章,往下主要是從操作系統(tǒng)的角度看程序運行性的各種情況。
第八章,叫“異??刂屏鳌?,“異常”這個概念大家肯定都聽過,不過這里主要指的是操作系統(tǒng)中的異常及中斷的工作流程,不過也簡要討論了高級編程語言中的異常。
第九章,叫“虛擬內(nèi)存”,虛擬內(nèi)存在現(xiàn)代操作系統(tǒng)中非常重要,這一章主要討論虛擬內(nèi)存的各種管理機制,以及現(xiàn)在很熱門的垃圾收集(GC),還延伸了一點安全人員很感興趣的內(nèi)存泄露方面的討論。
第十章,叫“系統(tǒng)級IO”,主要介紹文件系統(tǒng)的讀寫等操作接口。要是能對文件系統(tǒng)本身多展開一點內(nèi)容就更好了。這一章也是“程序間的交互和通信”部分的第一章,往下說的就都是各種IO了。
第十一章和第十二章分別介紹了“網(wǎng)絡(luò)編程”和“并發(fā)編程”,至此主流的各種IO就全部介紹了一遍。5