www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 公眾號精選 > 架構師社區(qū)
[導讀]本文來源: https://www.jianshu.com/p/a8f653fc0c54 本文內容95%譯自這篇文章https://github.com/brettwooldridge/HikariCP/wiki/About-Pool-Sizing 我在研究HikariCP(一個數據庫連接池)時無意間在HikariCP的Github wiki上看到了一篇文章(即前面給出的鏈

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

本文來源:

https://www.jianshu.com/p/a8f653fc0c54


本文內容95%譯自這篇文章https://github.com/brettwooldridge/HikariCP/wiki/About-Pool-Sizing

我在研究HikariCP(一個數據庫連接池)時無意間在HikariCP的Github wiki上看到了一篇文章(即前面給出的鏈接),這篇文章有力地消除了我一直以來的疑慮,看完之后感覺神清氣爽。故在此做譯文分享。

接下來是正文

數據庫連接池的配置是開發(fā)者們常常搞出坑的地方,在配置數據庫連接池時,有幾個可以說是和直覺背道而馳的原則需要明確。

1萬并發(fā)用戶訪問

想象你有一個網站,壓力雖然還沒到Facebook那個級別,但也有個1萬上下的并發(fā)訪問——也就是說差不多2萬左右的TPS。那么這個網站的數據庫連接池應該設置成多大呢?結果可能會讓你驚訝,因為這個問題的正確問法是:

  • “這個網站的數據庫連接池應該設置成多呢?”

下面這個視頻是Oracle Real World Performance Group發(fā)布的,請先看完:
http://www.dailymotion.com/video/x2s8uec

(因為這視頻是英文解說且沒有字幕,我替大家做一下簡單的概括:)
視頻中對Oracle數據庫進行壓力測試,9600并發(fā)線程進行數據庫操作,每兩次訪問數據庫的操作之間sleep 550ms,一開始設置的中間件線程池大小為2048:

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

初始的配置

壓測跑起來之后是這個樣子的:

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

2048連接時的性能數據

每個請求要在連接池隊列里等待33ms,獲得連接后執(zhí)行SQL需要77ms

此時數據庫的等待事件是這個熊樣的:

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

各種buffer busy waits

各種buffer busy waits,數據庫CPU在95%左右(這張圖里沒截到CPU)

接下來,把中間件連接池減到1024(并發(fā)什么的都不變),性能數據變成了這樣:

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

連接池降到1024后

獲取鏈接等待時長沒怎么變,但是執(zhí)行SQL的耗時減少了。
下面這張圖,上半部分是wait,下半部分是吞吐量

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

wait和吞吐量

能看到,中間件連接池從2048減半之后,吐吞量沒變,但wait事件減少了一半。

接下來,把數據庫連接池減到96,并發(fā)線程數仍然是9600不變。

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

96個連接時的性能數據

隊列平均等待1ms,執(zhí)行SQL平均耗時2ms。

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!


wait事件幾乎沒了,吞吐量上升。

沒有調整任何其他東西,僅僅只是縮小了中間件層的數據庫連接池,就把請求響應時間從100ms左右縮短到了3ms。

But why?

為什么nginx只用4個線程發(fā)揮出的性能就大大超越了100個進程的Apache HTTPD?回想一下計算機科學的基礎知識,答案其實是很明顯的。

即使是單核CPU的計算機也能“同時”運行數百個線程。但我們都[應該]知道這只不過是操作系統(tǒng)用時間分片玩的一個小把戲。一顆CPU核心同一時刻只能執(zhí)行一個線程,然后操作系統(tǒng)切換上下文,核心開始執(zhí)行另一個線程的代碼,以此類推。給定一顆CPU核心,其順序執(zhí)行AB永遠比通過時間分片“同時”執(zhí)行AB要快,這是一條計算機科學的基本法則。一旦線程的數量超過了CPU核心的數量,再增加線程數系統(tǒng)就只會更慢,而不是更快。

幾乎就是真理了……

有限的資源

上面的說法只能說是接近真理,但還并沒有這么簡單,有一些其他的因素需要加入。當我們尋找數據庫的性能瓶頸時,總是可以將其歸為三類:CPU、磁盤、網絡。把內存加進來也沒有錯,但比起磁盤網絡,內存的帶寬要高出好幾個數量級,所以就先不加了。

如果我們無視磁盤網絡,那么結論就非常簡單。在一個8核的服務器上,設定連接/線程數為8能夠提供最優(yōu)的性能,再增加連接數就會因上下文切換的損耗導致性能下降。數據庫通常把數據存儲在磁盤上,磁盤又通常是由一些旋轉著的金屬碟片和一個裝在步進馬達上的讀寫頭組成的。讀/寫頭同一時刻只能出現在一個地方,然后它必須“尋址”到另外一個位置來執(zhí)行另一次讀寫操作。所以就有了尋址的耗時,此外還有旋回耗時,讀寫頭需要等待碟片上的目標數據“旋轉到位”才能進行操作。使用緩存當然是能夠提升性能的,但上述原理仍然成立。

在這一時間段(即"I/O等待")內,線程是在“阻塞”著等待磁盤,此時操作系統(tǒng)可以將那個空閑的CPU核心用于服務其他線程。所以,由于線程總是在I/O上阻塞,我們可以讓線程/連接數比CPU核心多一些,這樣能夠在同樣的時間內完成更多的工作。

那么應該多多少呢?這要取決于磁盤。較新型的SSD不需要尋址,也沒有旋轉的碟片??蓜e想當然地認為“SSD速度更快,所以我們應該增加線程數”,恰恰相反,無需尋址和沒有旋回耗時意味著更少的阻塞,所以更少的線程[更接近于CPU核心數]會發(fā)揮出更高的性能。只有當阻塞創(chuàng)造了更多的執(zhí)行機會時,更多的線程數才能發(fā)揮出更好的性能。

網絡磁盤類似。通過以太網接口讀寫數據時也會形成阻塞,10G帶寬會比1G帶寬的阻塞少一些,1G帶寬又會比100M帶寬的阻塞少一些。不過網絡通常是放在第三位考慮的,有些人會在性能計算中忽略它們。

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

上圖是PostgreSQL的benchmark數據,可以看到TPS增長率從50個連接數開始變緩。在上面Oracle的視頻中,他們把連接數從2048降到了96,實際上96都太高了,除非服務器有16或32顆核心。

計算公式

下面的公式是由PostgreSQL提供的,不過我們認為可以廣泛地應用于大多數數據庫產品。你應該模擬預期的訪問量,并從這一公式開始測試你的應用,尋找最合適的連接數值。

連接數 = ((核心數 * 2) + 有效磁盤數)

核心數不應包含超線程(hyper thread),即使打開了hyperthreading也是。如果活躍數據全部被緩存了,那么有效磁盤數是0,隨著緩存命中率的下降,有效磁盤數逐漸趨近于實際的磁盤數。這一公式作用于SSD時的效果如何尚未有分析。

按這個公式,你的4核i7數據庫服務器的連接池大小應該為((4 * 2) + 1) = 9。取個整就算是是10吧。是不是覺得太小了?跑個性能測試試一下,我們保證它能輕松搞定3000用戶以6000TPS的速率并發(fā)執(zhí)行簡單查詢的場景。如果連接池大小超過10,你會看到響應時長開始增加,TPS開始下降。

筆者注:
這一公式其實不僅適用于數據庫連接池的計算,大部分涉及計算和I/O的程序,線程數的設置都可以參考這一公式。我之前在對一個使用Netty編寫的消息收發(fā)服務進行壓力測試時,最終測出的最佳線程數就剛好是CPU核心數的一倍。

公理:你需要一個小連接池,和一個充滿了等待連接的線程的隊列

如果你有10000個并發(fā)用戶,設置一個10000的連接池基本等于失了智。1000仍然很恐怖。即是100也太多了。你需要一個10來個連接的小連接池,然后讓剩下的業(yè)務線程都在隊列里等待。連接池中的連接數量應該等于你的數據庫能夠有效同時進行的查詢任務數(通常不會高于2*CPU核心數)。

我們經常見到一些小規(guī)模的web應用,應付著大約十來個的并發(fā)用戶,卻使用著一個100連接數的連接池。這會對你的數據庫造成極其不必要的負擔。

請注意

連接池的大小最終與系統(tǒng)特性相關。

比如一個混合了長事務和短事務的系統(tǒng),通常是任何連接池都難以進行調優(yōu)的。最好的辦法是創(chuàng)建兩個連接池,一個服務于長事務,一個服務于短事務。

再例如一個系統(tǒng)執(zhí)行一個任務隊列,只允許一定數量的任務同時執(zhí)行,此時并發(fā)任務數應該去適應連接池連接數,而不是反過來。

特別推薦一個分享架構+算法的優(yōu)質內容,還沒關注的小伙伴,可以長按關注一下:

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

長按訂閱更多精彩▼

數據庫鏈接池終于搞對了,這次直接從100ms優(yōu)化到3ms!

如有收獲,點個在看,誠摯感謝

免責聲明:本文內容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯系我們,謝謝!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉