什么是Python中的全局解釋器鎖
全局解釋器鎖(Global Interpreter Lock)是計算機程序設(shè)計語言解釋器用于同步線程的一種機制,它使得任何時刻僅有一個線程在執(zhí)行。即便在多核處理器上,使用 GIL 的解釋器也只允許同一時間執(zhí)行一個線程,常見的使用 GIL 的解釋器有CPython與Ruby MRI??梢钥吹紾IL并不是Python獨有的特性,是解釋型語言處理多線程問題的一種機制而非語言特性。Python是一門解釋器語言,代碼通過解釋器執(zhí)行,Python存在多種解釋器,分別基于不同語言開發(fā),每個解釋器有不同的特點。CPython是主流版本的解釋器,這個解釋器是使用C語言編寫的,也是使用最為廣泛的解釋器,可以方便地和C/C++的類庫進行交互,因此也是最受關(guān)注的解釋器。一種由java語言編寫的python解釋器,是將python編譯成Java字節(jié)碼然后執(zhí)行的一種解釋器,可以方便地和Java的類庫進行交互。將Python代碼解釋為.Net平臺上運行的字節(jié)碼進行執(zhí)行,類似Jython解釋器,可以方便的和.Net平臺上的類庫進行交互。
Python 多線程(Multithreading)是一種編程技術(shù),允許在同一程序中同時執(zhí)行多個獨立的邏輯流,即線程。每個線程都有自己的程序計數(shù)器、??臻g和局部變量,它們共享同一進程的全局變量、文件描述符和其他系統(tǒng)資源。線程是操作系統(tǒng)調(diào)度的基本單位,能夠在單個進程中并發(fā)運行,從而實現(xiàn)任務(wù)的并行處理,提高程序的執(zhí)行效率和響應(yīng)速度。
概念要點:并發(fā)執(zhí)行:多線程允許程序的不同部分(即各個線程)同時(或近乎同時)執(zhí)行,給用戶帶來并行處理的感覺,即使在單核處理器上也能通過時間片輪轉(zhuǎn)實現(xiàn)并發(fā)。資源共享:同一進程中的所有線程共享相同的內(nèi)存地址空間,包括全局變量、堆內(nèi)存等。這意味著線程之間可以直接讀寫共享數(shù)據(jù),但也可能導(dǎo)致競態(tài)條件、死鎖等同步問題,需要通過同步機制(如鎖、條件變量等)來協(xié)調(diào)對共享資源的訪問。輕量級進程:相對于創(chuàng)建新進程,創(chuàng)建線程的開銷較小,因為線程之間不需要復(fù)制整個地址空間。這使得線程成為處理大量并發(fā)任務(wù)或頻繁切換任務(wù)時的理想選擇。
全局解釋器鎖(GIL):在 CPython(Python 的標(biāo)準(zhǔn)實現(xiàn))中,有一個全局解釋器鎖(GIL),它限制了同一時刻只有一個線程能夠執(zhí)行 Python 字節(jié)碼。這意味著在多核 CPU 上,Python 線程并不能實現(xiàn)真正的并行計算。對于計算密集型任務(wù),通常建議使用多進程或多線程與多進程結(jié)合的方式來利用多核優(yōu)勢。
在交互效果上有所增強,但執(zhí)行過程和功能方面和CPython是一樣的。一種使用JIT(just-in-time)技術(shù)的編譯器,專注于執(zhí)行速度,對Python代碼進行動態(tài)編譯,從而提高Python的執(zhí)行速度。PyPy在處理python代碼的過程中,一小部分功能的處理和CPython的執(zhí)行結(jié)果是有差異的,如果項目中要使用PyPy來進行執(zhí)行效率的提升的話,一定要事先了解下PyPy和CPython的區(qū)別。
CPython的線程是操作系統(tǒng)的原生線程,在Linux的pthread完全由操作系統(tǒng)調(diào)度執(zhí)行。pthread本身不是線程安全的,需要使用者通過鎖來實現(xiàn)多線程的安全運行,因此CPython解釋器下的Python實現(xiàn)多線程也必然存在線程不安全的問題。這就為GIL在多核時代的使用埋下了隱患。Python是Guido van Rossum 在1989年發(fā)布的,那個時候計算機的主頻還沒有達到1G,程序全部都是運行在單核計算機上面,直到2005年多核處理器才被Intel開發(fā)出來。
戈登·摩爾 1965 年預(yù)測,每個集成電路的元件數(shù)量每 18 到 24 個月就會翻一倍,它的適用性預(yù)計會持續(xù)到 2015-2020 年。摩爾定律未失效前軟件系統(tǒng)可以單純借助硬件的進步來獲得性能的提升或者只需少量改進,就可以坐享性能飛躍。然而從 2005 年開始,時鐘速率的增長和晶體管數(shù)量的增長已不再同步。由于處理器材料的物理性質(zhì)限制,時鐘速率已停止增長甚至下降,處理器制造商開始將更多執(zhí)行單元核心封裝到單個芯片中。這一趨勢給應(yīng)用程序開發(fā)和編程語言設(shè)計帶來越來越大的壓力。
程序員和編程語言決策者不得不考慮如何快速適應(yīng)多核硬件,來提高軟件性能和編程語言的市場占有率,Python也不例外受到?jīng)_擊。在單核時代,崇尚優(yōu)美、清晰、簡單的吉多.范羅蘇姆選擇在解釋器層面實現(xiàn)了一把全局互斥鎖,來保護Python對象從而實現(xiàn)對單核CPU的使用率,這種做法在單核時代很奏效。倘若在單核時未選擇GIL,那么開發(fā)者就需要自己實現(xiàn)任務(wù)的管理,這樣做對于CPU的利用率提高無法做到極致。
但是隨著多核時代的到來,高效地利用CPU 核心的有效方法就是使用并行性,多線程是充分實現(xiàn)并行的好方法,但是CPython的GIL卻阻礙了對多核CPU的利用。CPython的GIL給使用者帶來了便利,并且在GIL的基礎(chǔ)上開發(fā)了許多重要的Package和語言功能。但是多核CPU的普適和其他語言對Python的沖擊,讓GIL顯得原始而粗暴,無法有效利用多核處理器成為了弊端。
Python的多線程是通過 threading模塊 實現(xiàn)同一進程內(nèi)的并發(fā)執(zhí)行流,適用于I/O密集型任務(wù)(如文件讀寫、網(wǎng)絡(luò)請求等),但受 GIL鎖 限制無法實現(xiàn)多核并行計算。 ??實現(xiàn)方式?:Python多線程本質(zhì)上是同一進程內(nèi)的并發(fā)執(zhí)行,通過 CPython解釋器 的 GIL (Global Interpreter Lock)實現(xiàn),任何線程執(zhí)行前需先獲得鎖,執(zhí)行100條指令后自動釋放鎖,導(dǎo)致多線程無法同時運行。 ??適用場景?:適合文件處理、網(wǎng)絡(luò)通信等I/O密集型任務(wù),通過釋放GIL鎖實現(xiàn)非阻塞操作,提升程序響應(yīng)性。 ??局限性?:無法通過多線程有效利用多核CPU,實際運行效率受限于單核性能。?線程共享資源?:所有線程共享進程的內(nèi)存空間和文件句柄,但每個線程擁有獨立的CPU寄存器上下文。 ?互斥鎖 (Mutex)?:用于保護共享資源,避免多個線程同時操作同一數(shù)據(jù)導(dǎo)致沖突。
隨著Python 3.11引入的plaintext復(fù)制threading模塊優(yōu)化,以及JIT編譯器的逐步普及,多線程在以下領(lǐng)域?qū)⒄宫F(xiàn)更大潛力:實時數(shù)據(jù)處理系統(tǒng),分布式微服務(wù)架構(gòu),機器學(xué)習(xí)流水線優(yōu)化,建議開發(fā)者結(jié)合具體業(yè)務(wù)場景,通過性能分析工具(如cProfile)持續(xù)優(yōu)化線程模型,充分發(fā)揮Python多線程在并發(fā)編程中的獨特優(yōu)勢。
?