作者簡介:
邢孟棒,曾供職于阿里、網(wǎng)易,目前在騰訊云專職做性能優(yōu)化方向。Linux 業(yè)余愛好者,偏好鉆研各類工具源碼與底層技術原理。在日常的性能工程實踐中,比較注重方法論的探索、優(yōu)化案例的沉淀。熱衷于 eBPF 技術,擅長傳統(tǒng)工具與 BPF 工具的結合應用。
一、性能工程師書單推薦
推薦1:《Linux 命令行與 shell 腳本編程大全》
這是一本關于 Linux命令行與shell腳本編程的全方位教程,主要包括四大部分:Linux命令行,shell腳本編程基礎,高級shell腳本編程,如何創(chuàng)建實用的shell腳本。尤其推薦閱讀第 5 章,幫助理解 shell 執(zhí)行原理與子 shell 用法。
推薦2:《Linux/Unix 系統(tǒng)編程手冊》
個人覺得這本書已超越經(jīng)典書籍 APUE,非常值得推薦。本書詳細描述了 Linux/Unix 系統(tǒng)編程所涉及的逾 500 個系統(tǒng)調用和庫函數(shù),并輔之以全面而清晰的逾 200 個程序示例。
推薦3:《Linux 內核設計與實現(xiàn)》
簡稱LKD,內核新人首選必讀的書籍,幫助快速了解 Linux 內核設計與實現(xiàn)。相比大部頭 ULK,本書不糾結于太多細節(jié),整體讀起來壓力較小。
推薦4:《程序員的自我修養(yǎng):鏈接、裝載與庫》
推薦作為深入學習系統(tǒng)軟件運行機制和原理的參考書,涉及應用程序在編譯、鏈接和運行時相關實現(xiàn)細節(jié),包括代碼指令如何保存,庫文件如何與應用程序代碼靜態(tài)鏈接,應用程序如何被裝載到內存中并開始運行,動態(tài)鏈接如何實現(xiàn)等。
推薦5:《性能之巔》
系統(tǒng)學習性能優(yōu)化必備書籍,尤其是文中提及的性能方法,受益匪淺。本書介紹了操作系統(tǒng)和應用程序的概念、策略、工具和調優(yōu),并用基于 Linux 的操作系統(tǒng)作為主要示例。本書的主要內容包括:硬件、內核和應用程序的內部結構,以及它們的工作機制,對復雜系統(tǒng)進行性能分析的方法,針對 CPU、內存、文件系統(tǒng)、磁盤和網(wǎng)絡的優(yōu)化手段,以及如何使用 perf、Ftrace和BPF (BCC和bpftrace)進行復雜的剖析和跟蹤。
推薦6:《BPF 之巔》
系統(tǒng)學習 BPF 技術必備書籍。作為一名性能工程師,我在平時的工作中大量使用 BPF 工具,通過觀測內核行為協(xié)助分析定位性能問題。本書展示了超過150個可以立即使用的 BPF 性能分析工具,對這些工具的應用場景進行了分析,還提供了開發(fā)自定義工具的分步指南。在本書中,讀者可學習到如何利用 BPF 提供的強大觀測能力分析 CPU、內存、存儲設備、文件系統(tǒng)、網(wǎng)絡、編程語言、應用程序、容器、虛擬機管理器、安全及內核。
二、性能工程常見誤區(qū)
誤區(qū) 1:不求甚解,誤用或濫用性能工具。
工具、指標與方法是性能分析與優(yōu)化的三個要素。當遇到性能瓶頸時,恰當?shù)臅r機選擇恰當?shù)男阅芄ぞ呖梢允掳牍Ρ丁H欢?,想要把性能工具用好,一方面離不開對其所揭示的關鍵性能指標以及背后基礎原理的深入理解,另一方面需要輔以性能方法作理論指導。僅掌握性能工具自身的基礎用法,容易誤用或濫用,對目標系統(tǒng)產生非必要的副作用(觀察者效應)。工具、指標與方法相輔相成,如果能夠熟練掌握,那么你已經(jīng)是一位夠格的性能工程師。
誤區(qū) 2:手忙腳亂,遇到問題時眉毛胡子一把抓。
究其原因,主要是缺少有效的性能方法作理論指導。當面對存在性能問題的復雜系統(tǒng)環(huán)境時,好的性能方法可以幫助你更好的了解系統(tǒng)現(xiàn)狀,并指導你從哪里開始做分析,什么情況下關注哪些指標以及使用哪些推薦工具。掌握常見的性能方法,例如 USE 方法、CPU 剖析、off-CPU 分析、系統(tǒng)調用分析等,助你逐漸形成遇事不亂、有章可循的優(yōu)秀職業(yè)素養(yǎng)。
誤區(qū) 3:望而卻步,不了解組件實現(xiàn)邏輯難以對其分析。
『懷疑這個組件有問題,但我不太了解它的具體實現(xiàn)邏輯,還是直接找開發(fā)者或者熟悉它的人分析一下』這是逃避性能問題的一種常見推辭,實際上卻在錯失成為高手的機會。我們可以把某個組件當做黑盒去分析,具體的分析手段有很多,比如通過系統(tǒng)資源分析識別出影響業(yè)務性能的具體資源、調整網(wǎng)絡參數(shù)解決業(yè)務數(shù)據(jù)包接收存在延遲抖動問題、CPU 剖析找出熱點函數(shù)發(fā)生的代碼路徑、off-CPU 分析線程阻塞的具體原因、系統(tǒng)調用分析識別出組件 IO 寫延遲存在異常值等等。面對未知問題時不退卻,積極迎接,可以讓你走在多數(shù)人前面。
誤區(qū) 4:一葉障目,陷入源碼細節(jié)難以自拔。
在實際工作中,遇到一些同事在處理性能問題時,容易抓住某個可疑點不松手,并陷入到應用或內核源碼細節(jié)里面跳出不來,偏離問題的實際方向而浪費了較多時間。建立性能全局觀作為破解之道,助你及時調整問題的關注重點,避免過早陷入源碼細節(jié)。
誤區(qū) 5:安于現(xiàn)狀,邁不出改進或創(chuàng)造性能工具的步子。
使用性能工具的三重境界:掌握工具的基本用法、熟練使用且了解工具基本原理、改進工具或創(chuàng)建新工具。當現(xiàn)有工具不能滿足你的實際需求時,不妨試著對其進行改進或者創(chuàng)造屬于自己的工具。也許你會很快嘗到甜頭,并且一發(fā)不可收拾。