Linux系統(tǒng)進程的知識總結(jié),進程與線程之間的糾葛
我們先打個比方,多線程是十字路口多線程是平面交通系統(tǒng),造價低,但是紅綠燈多,老堵車,而多進程是則是立交橋,雖然造價高,上下坡多耗油,但是不堵車。這是一個抽象的概念。相信大家看完會有這種感覺。
進程和線程是兩個相對的概念,通常來說,一個進程可以定義程序的一個實例(Instance)。在Win32中,進程并不執(zhí)行什么,它只是占據(jù)應用程序所使用的地址空間。為了讓進程完成一定的工作,進程必須至少占有一個線程,正是這個線程負責包含進程地址空間中的代碼。實際上,一個進程可以包含幾個線程,它們可以同時執(zhí)行進程地址空間中的代碼。為了做到這一點,每個線程有自己的一組CPU寄存器和堆棧。每個進程中至少有 一個線程在執(zhí)行其地址空間中的代碼。如果沒有線程執(zhí)行進程地址空間中的代碼,進程也就沒有繼續(xù)存在的理由,系統(tǒng)將自動清除進程及其地址空間。
多線程的實現(xiàn)原理
創(chuàng)建一個進程時,它的第一個線程稱為主線程(Primary thread),由系統(tǒng)自動生成。然后可以由這個主線程生成額外的線程,而這些線程,又可以生成更多的線程。在運行一個多線程的程序時,從表面上看,這些線程似乎在同時運行。而實際情況并非如此,為了運行所有的這些線程,操作系統(tǒng)為每個獨立線程安排一些CPU時間。單CPU操作系統(tǒng)以時間片輪轉(zhuǎn)方式向線程提供時間片(Quantum),每個線程在使用完時間片后交出控制,系統(tǒng)再將CPU時間片分配給下一個線程。由于每個時間片足夠的短,這樣就給人一種假象,好像這些線程在同時運行。創(chuàng)建額外線程的唯一目的就是盡可能地利用CPU時間。
多線程的問題
使用多線程編程可以給程序員帶來很大的靈活性,同時也使原來需要復雜技巧才能解決的問題變得容易起來。但是,不應該人為地將編寫的程序分成一些碎片,讓這些碎片按各自的線程執(zhí)行,這不是開發(fā)應用程序的正確方法。線程很有用,但當使用線程時,可能會在解決老問題的同時產(chǎn)生新問題。例如要開發(fā)一個字處理程序,并想讓打印功能作為單獨的線程自己執(zhí)行。這聽起來是很好的主意,因為在打印時,用戶可立即返回,開始編輯文檔。但這樣一來,在該文檔被打印時文檔中的數(shù)據(jù)就有可能被修改,打印的結(jié)果就不再是所期望的內(nèi)容。也許最好不要把打印功能放在單獨的線程中,不過如果一定要用多線程的話,也可以考慮用下面的方法解決:第一種方法是鎖定正在打印的文檔,讓用戶編輯其他的文檔,這樣在結(jié)束打印之前,該文檔不會作任何修改;另一個方法可能更有效一些,即可以把該文檔拷貝到一個臨時文件中,打印這個臨時文件的內(nèi)容,同時允許用戶對原來的文檔進行修改。當包含文檔的臨時文件打印完成時,再刪去這個臨時文件。通過上面的分析可以看出,多線程在幫助解決問題的同時也可能帶來新問題。因此有必要弄清楚,什么時候需要創(chuàng)建多線程,什么時候不需要多線程??偟膩碚f,多線程往往用于在前臺操作的同時還需要進行后臺的計算或邏輯判斷的情況。
線程的分類
在MFC中,線程被分為兩類,即工作線程和用戶界面線程。如果一個線程只完成后臺計算,不需要和用戶交互,那么可以使用工作線程;如果需要創(chuàng)建一個處理用戶界面的線程,則應使用用戶界面線程。這兩者的主要區(qū)別在于,MFC框架會給用戶界面線程增加一個消息循環(huán),這樣用戶界面線程就可以處理自己消息隊列中的消息。這樣看來,如果需要在后臺作一些簡單的計算(如對電子表格的重算),則首先應考慮使用工作線程,而當 后臺線程需要處理比較復雜的任務,確切地說,當后臺線程的執(zhí)行過程會隨著實際情況的不同而改變時,就應該使用用戶界面線程,以便能對不同的消息作出響應。
線程的優(yōu)先級
當系統(tǒng)需要同時執(zhí)行多個進程或多個線程時,有時會需要指定線程的優(yōu)先級。線程的優(yōu)先級一般是指這個線程的基優(yōu)先級,即線程相對于本進程的相對優(yōu)先級和包含此線程的進程的優(yōu)先級的結(jié)合。操作系統(tǒng)以優(yōu)先級為基礎安排所有的活動線程,系統(tǒng)的每一個線程都被分配了一個優(yōu)先級,優(yōu)先級的范圍從0到31。運行時,系統(tǒng)簡單地給第一個優(yōu)先級為31的線程分配CPU時間,在該線程的時間片結(jié)束后,系統(tǒng)給下一個優(yōu)先級為31的線程分配CPU時間。當沒有優(yōu)先級為31的線程時,系統(tǒng)將開始給優(yōu)先級為30的線程分配CPU時間,以此類推。除了程序員在程序中改變線程的優(yōu)先級外,有時程序在執(zhí)行過程中系統(tǒng)也會自動地動態(tài)改變線程的優(yōu)先級,這是為了保證系統(tǒng)對終端用戶的高度響應性。比如用戶按了鍵盤上的某個鍵時,系統(tǒng)就會臨時將處理WM_KEYDOWN消息的線程的優(yōu)先級提高2到3。CPU按一個完整的時間片執(zhí)行線程,當時間片執(zhí)行完畢后,系統(tǒng)將該線程的優(yōu)先級減1。
線程的同步
在使用多線程編程時,還有一個非常重要的問題就是線程同步。所謂線程同步是指線程之間在相互通信時避免破壞各自數(shù)據(jù)的能力。同步問題是由前面說到的Win32系統(tǒng)的CPU時間片分配方式引起的。雖然在某一時刻,只有一個線程占用CPU(單CPU時)時間,但是沒有辦法知道在什么時候,在什么地方線程被打斷,這樣如何保證線程之間不破壞彼此的數(shù)據(jù)就顯得格外重要。在MFC中,可以使用4個同步對象來保證多線程同時運行。它們分別是臨界區(qū)對象(CCriticalSection)、互斥量對象(CMutex)、信號量對象(CS emaphore)和事件對象(CEvent)。在這些對象中,臨界區(qū)對象使用起來最簡單,它的缺點是只能同步同一個進程中的線程。另外,還有一種基本的方法,本文稱為線性化方法,即在編程過程中對一定數(shù)據(jù)的寫操作都在一個線程中完成。這樣,由于同一線程中的代碼總是按順序執(zhí)行的,就不可能出現(xiàn)同時改寫數(shù)據(jù)的情況。
總結(jié):
在線程中(相對與進程而言),線程是一個更加接近執(zhí)行體的概念,它可以與同進程的其他線程共享數(shù)據(jù),但擁有自己的??臻g,擁有獨立的執(zhí)行序列。這兩者都可以提高程序的并發(fā)度,提高程序運行的效率和響應的時間。線程和進程在使用上各有優(yōu)缺點:線程執(zhí)行開銷小,但不利于資源管理和保護;而進程正好相反。根本的區(qū)別就一點:用多進程每個進程有自己的地址空間,線程則共享地址空間,在速度方面:線程產(chǎn)生的速度快,線程間的通訊快,切換快等,因為他們在同一地址空間內(nèi)。在資源利用率方面:線程的資源率比較好也是因為他們在同一地址空間內(nèi)。 在同步方面:線程使用公共變量/內(nèi)存時需要使用同步機制,因為他們在同一地址空間內(nèi)進程中:子進程是父進程的復制品,子進程獲得父進程數(shù)據(jù)空間、堆和棧的復制品。