Centos系統上下文切換的檢查思路
Centos系統上下文切換的檢查思路
1.什么是上下文切換(Context Switch)?
上下文切換,有時也稱做進程切換或任務切換,是指CPU從一個進程或線程切換到另一個進程或線程。
操作系統可以同時運行多個進程, 然而一顆CPU同時只能執行一項任務,操作系統利用時間片輪轉的方式,讓用戶感覺這些任務正在同時進行。 CPU給每個任務都服務一定的時間, 然后把當前任務的狀態保存下來, 在加載下一任務的狀態后, 繼續服務下一任務。任務的狀態保存及再加載, 這段過程就叫做上下文切換。
當一個進程在執行時,CPU的所有寄存器中的值、進程的狀態以及堆棧中的內容被稱 為該進程的上下文。當內核需要切換到另一個進程時,它需要保存當前進程的 所有狀態,即保存當前進程的上下文,以便在再次執行該進程時,能夠必得到切換時的狀態執行下去。在LINUX中,當前進程上下文均保存在進程的任務數據結 構中。在發生中斷時,內核就在被中斷進程的上下文中,在內核態下執行中斷服務例程。但同時會保留所有需要用到的資源,以便中繼服務結束時能恢復被中斷進程 的執行。
2.上下文切換的消耗?
直接消耗包括: CPU寄存器需要保存和加載,系統調度器的代碼需要執行,TLB實例需要重新加載,CPU 的pipeline需要刷掉。
間接消耗:多核的cache之間得共享數據,間接消耗對于程序的影響要看線程工作區操作數據的大小。
上下文切換通常是計算密集型的。也就是說,它需要相當可觀的處理器時間,在每秒幾十上百次的切換中,每次切換都需要納秒量級的時間。所以,上下文切換對系統來說意味著消耗大量的 CPU 時間,事實上,可能是操作系統中時間消耗最大的操作。
3.如何檢查上下文切換是否頻繁?
(1)確認CPU使用率
CPU是否處于空閑狀態。
(2)vmstat 1
從vmstat的輸出可以看到,io項的block_in和block_out是否頻繁,system項的每秒中斷數(in)和每秒的上下文切換(cs)是否頻繁。
(3)
pidstat -w 1
從pidstat上可以看到,每個進程對應的cswch(自愿上下文切換)和nvcswch(非自愿上下文切換)是否頻繁。
cswch/s: 每秒任務主動(自愿的)切換上下文的次數,當某一任務處于阻塞等待時,將主動讓出自己的CPU資源。
nvcswch/s: 每秒任務被動(不自愿的)切換上下文的次數,CPU分配給某一任務的時間片已經用完,因此將強迫該進程讓出CPU的執行權。
(4)/proc/stat
/proc/stat包含了CPU的活動信息,上下文切換就是其中一項,以ctxt開頭,它表示系統開機到目前為止的上下文切換總數。
cat /proc/stat | grep ctxt && sleep 30 && cat /proc/stat | grep ctxt
通過上面的命令,可以計算出每秒上下文切換次數=兩者差值/30
通過以上命令即可以定位那個進程上下文切換頻繁。
4.造成上下文切換頻繁的原因?
當前執行任務的時間片用完之后, 系統CPU正常調度下一個任務
當前執行任務碰到IO阻塞, 調度器將掛起此任務, 繼續下一任務
多個任務搶占鎖資源, 當前任務沒有搶到,被調度器掛起, 繼續下一任務
用戶代碼掛起當前任務, 讓出CPU時間
硬件中斷