進程知多少?

文章首發:進程知多少?算法

Java 多線程系列文章第 1 篇編程

要講線程,通常都得講一講進程,進程是何方神聖呢?下面來簡單介紹一下。設計模式

先經過任務管理器看看 Windows 系統下的進程。微信

從圖片來看,每個進程都佔有 CPU、內存、磁盤、網絡等資源。站在操做系統的角度,進程是分配資源的基本單位,也是最小單位markdown

進程爲何出現?

引入進程的目的:爲了使多個程序能併發執行,以提升資源的利用率和系統的吞吐量。怎麼理解這句話呢?一個程序在運行過程當中會涉及不少操做,利用 CPU 計算、經過磁盤 IO 進行數據傳輸等等,咱們知道當程序在進行磁盤 IO 的時候,由於速度問題,會比較慢,所在在這個過程當中 CPU 會空閒下來,這會形成資源的浪費,正由於引入進程,在 A 進程進行磁盤 IO 的時候,會讓出 CPU 給 B 進程,合理地利用了 CPU 資源,使得程序之間能夠併發執行。網絡

從 CPU 角度,執行過程是這樣子的:CPU 一直在負責執行指令,進程之間互相競爭 CPU 資源,下圖有 A 和 B 進程,在一個時間點,CPU 只執行一個進程的指令,由於 CPU 運行很快,因此在我們看起來,像是多個進程在同時跑。這就是進程帶來的好處:提升資源利用率,併發地執行多個程序多線程

固然引入進程也不是有益無害,它增長了系統的時間空間開銷。空間開銷這個好理解,進程有本身的組成部分(下面會講),這個就佔用了空間。時間開銷則是進程切換須要時間。併發

進程的組成

進程由 3 個部分組成,分別是程序代碼數據集、棧進程控制塊(Process Control Block)oop

各自的做用以下:學習

  1. 程序代碼:描述了進程須要完成的功能。
  2. 數據集、棧:程序在執行時所須要的數據和工做區。
  3. 進程控制塊:包含進程的描述信息和控制信息,它是進程存在的惟一標識。

如何競爭資源(調度算法)

進程之間須要競爭資源,通常都是競爭 CPU 資源,由於 CPU 運行速度太快了,其餘介質都趕不上。有了競爭就須要有規則,就像遊戲同樣,每一個遊戲都須要規則,不一樣規則會有不一樣的側重點,這個看過「最強大腦」這個節目的朋友就很是清楚,每道題都有不一樣的考覈側重點,有些是側重空間思惟、有些側重邏輯推算等等。下面咱們就簡單地一一講解競爭資源的遊戲規則。

FCFS

First In First Out(先來先服務):最早進入就緒隊列的進程,先運行,運行到完成或者阻塞時,再從新調度。通常狀況下,這種調度算法會和優先級策略結合,好比每一個優先級一條隊列,每條隊列中的調度都使用 FCFS。

特色:簡單、比較偏於長進程、相對於其餘調度算法平均週轉時間長

RR

Round Robin(輪轉):進程按提交順序存在就緒隊列,依次輪流佔用 CPU 資源,運行一段固定的時間,時間到後若是還沒執行完,就繼續進入就緒隊列隊尾,排隊等待下次執行。

特色:公平、對進程的響應時間較短

SPN

Shortest Process Next(最短進程優先):將預期佔用運行時間最短的進程優先執行,直到運行完成或阻塞時,再從新調度。

特色:有利於短進程

SRT

Shortest Remaining Time(最短剩餘時間優先):新進程進來時,若是新進程的預計運行時間比當前進程的剩餘運行時間更短,就搶佔當前進程,

特色:有利於短進程,和 SPN 的差異在於搶佔這個一點,由於搶佔,因此效率會比 SPN 好一些。

HRRN

Highest Response Ratio Next(最高響應比優先):當前運行的進程完成或者阻塞時發生調度,每次調度前,計算全部就緒進程的響應比,響應比高的進程優先運行。

響應比公式以下所示:

特色:有利於短進程服務時間相同的進程,先來的服務會優先執行長進程由於在等待的過程當中,優先級愈來愈高,因此不會一直不執行

FB

Feedback (反饋):由多個就緒隊列組成的反饋機制,它有以下規則:

  1. 在同一個隊列的進程,按 FCFS 算法調度,最後一個就緒隊列按 RR 算法調度;
  2. 優先級越高的隊列,時間片越小;
  3. 進程在一個時間片內未運行完,則降到下一個隊列末尾;
  4. 只有上級隊列無就緒進程時,才運行本級就緒隊列,本級就緒隊列無進程時,才運行下級就緒隊列,以此類推

進程執行過程以下圖所示

特色:短進程有很是大的優點,排在前面的隊列都是時間較短的

以上就是幾個搶佔資源的調度算法的說明。

進程狀態

上面咱們講到,進程之間是在競爭資源,獲得資源就運行,沒獲得就等待,這個須要有狀態來維護,像不少系統同樣,須要一個狀態機。

三態圖

三態圖也是描述進程狀態最簡單最基礎的圖,它包含了進程的最基本的 3 個狀態,分別是:就緒態、運行態和阻塞態。

Read(就緒態):進程已獲得除 CPU 之外的其餘所需資源。 Running(運行態):進程的指令正被執行。 Blocked(阻塞態):進程正等待資源或某事件發生。

進程三態圖

就緒態的進程在被調度的時候,進入了運行態,若是時間片運行完或者有更高級別進程搶佔資源,則變成就緒態等待再次被調度;若是發生事件(好比 IO 事件),則從運行態轉到阻塞態,進入阻塞態的進程只能等待事件解除從新進入就緒態

五態圖

基於三態圖,新增了 2 個狀態,分別是:新建態和退出態。

New(新建態):進程正被建立。分配內存後將被設爲就緒態。

Exit(退出態):進程已正常結束或出現異常結束。回收資源。

進程五態圖

新進程剛建立尚未分配資源的時候是新建態,等到分配了資源,被加載後就進入就緒態。當進程運行完後,就從運行態進入退出態

七態圖

基於五態圖,新增了 2 種掛起態,分別是就緒掛起態和阻塞掛起態。

就緒掛起態:另叫外存就緒態。因爲內存容量有限,將原位於內存的就緒進程轉存到外存(磁盤)上。

阻塞掛起態:另叫外存阻塞態。同樣由於內存容量有限,將原位於內存的阻塞進程轉存到外存(磁盤)上。

七態圖

咱們能夠看出,圖中新增了解除掛起的狀態轉換過程,通常是因爲掛起進程優先級比較高或者內存空間足夠,把位於外存(磁盤)的進程轉存到內存中。

進程關係

進程之間其實比較獨立,好比咱們在平常使用的 QQ 和微信,它們運行起來的進程有什麼關係麼?其實除了互相競爭資源以外,沒有任何關係。

父子關係

雖然上面說的進程之間沒有關係,可是有一個特殊關係須要講,就是父子關係

先作個試驗,驗證進程的父子關係。操做步驟:

  1. 打開 CMD 命令行程序,將當前的窗口設置爲 Father,在 Father 窗口經過命令start cmd啓動另外一個 CMD 命令行程序;
  2. 將新開的 CMD 命令行程序的窗口設置爲 Son,在 Son 窗口經過命令start cmd啓動另外一個 CMD 命令行程序;
  3. 將新開的 CMD 命令行程序的窗口設置爲 Grandson。

操做過程以下圖所示。

經過 ProcessExplorer 能夠很清晰看到這 3 個 CMD 進程之間的關係。(想要 ProcessExplorer 插件能夠經過百度網盤下載連接:pan.baidu.com/s/19531gf5t… 提取碼:qhc6)

咱們看到 Father、Son、Grandson 三個進程呈現出咱們預料中的樹形。那麼什麼是父子進程呢?簡單的說就是在進程中建立出新的進程,這個新的進程就是子進程,一個進程能夠有多個子進程,可是隻能有一個父進程。在 Unix 系統中,父進程經過調用 fork() 建立子進程,父子進程有以下特色:

  1. 父、子進程併發執行;
  2. 父、子進程共享父進程的全部資源;
  3. 子進程複製父進程的地址空間,甚至有相同的正文段和程序計數器 PC 值;
  4. 利用寫時複製(Copy On Write)技術減小沒必要要的複製:fork 時父子共用父空間,當一方試圖修改時才複製。

這裏重點講一下Copy On Write,使用了這個技術,父進程建立子進程的時候不會複製全部數據到子進程,省了複製的時間以及減小了大量的內存。這個複製不是必要的,由於若是應用程序在進程複製以後當即加載新程序,那以前的複製工做就是浪費時間和內存了。

講了進程父子關係,就免不了提一下殭屍進程孤兒進程,下面分別介紹一下。

殭屍進程

殭屍進程:子進程退出後,父進程沒有調用 wait 或 waitpid 獲取子進程的狀態信息,子進程的進程描述符仍保存在系統中,這種進程叫殭屍進程。

殭屍進程的危害:殭屍進程會一直佔用進程號,系統能使用的進程號又是有限的,若是有大量的殭屍進程,會由於沒有可用進程號致使沒法建立新的進程。

孤兒進程

孤兒進程:父進程結束退出,而它的子進程還在運行,這時的子進程就叫作孤兒進程。孤兒進程就被 init 進程(進程號爲 1)收養,init 進程將對孤兒進程完成狀態收集工做。

孤兒進程沒有危害,由於被 init 進程託管了,init 進程會處理孤兒進程的收集工做。

執行模式

指令分爲特權指令(只能由操做系統內核使用的指令)和非特權指令(只能由用戶程序使用的指令),由於指令有特權和非特權之分,因此 CPU 也分爲 2 種執行模式:系統態(能夠執行全部指令,使用全部資源以及改變 CPU 狀態)和用戶態(只能執行非特權指令)。

CPU 的系統態和用戶態之間的切換。

進程間通信

當進程之間須要數據傳輸、共享數據時,進程間就須要互相通信,通信方式有以下幾種,這裏只是簡單歸納一下,不展開講,咱的重點在於多線程,進程我們簡單瞭解一下就能夠,感興趣的同窗能夠根據要點進行深刻學習。

管道(Pipe)

管道是半雙工通信,數據是單向流動,要創建進程間互相通信,則須要 2 個管道,這種通信方式只能在親戚關係的進程間使用,好比父子進程。

流管道(Flow Pipe)

流管道是管道進化來的,數據再也不是單向流動,能夠雙向流動,可是依舊是隻能在親戚關係的進程間使用。

有名管道(Named Pipe)

有名管道提供了新的功能,就是給管道設置名字,它改善了上面 2 種管道通信方式,支持了非親戚關係的進程通信。

信號量(Semophore)

信號量至關於計數器,利用它來控制多個進程訪問共享資源,當一個進程A在訪問共享資源時,信號量防止其餘進程來訪問,只有當進程A不訪問共享資源了,其餘進程才能訪問。

信號(Signal)

信號能夠在任什麼時候候發給某一進程,不須要知道該進程當前的狀態,若是對方進程未執行,信號會存在內核中,直到進程執行後傳遞給它;若是對方進程是阻塞,則信號會延遲傳遞,等到對方進程阻塞取消後才傳遞給它。

消息隊列(Message Queue)

消息隊列是存放在內核中的鏈表,能夠有多個進程對這個鏈表進行寫入和讀取,它解決了信號傳遞信息少、管道只能傳輸無格式字節流和緩衝區大小受限的缺點。目前有 POSIX 消息隊列和 System V 消息隊列。

共享內存(Shared Memory)

共享內存即爲一段能被其餘進程訪問的內存,多個進程訪問同一個內存,達到了通信的效果。

套接字(Socket)

套接字就是咱們網絡編程裏面的那個套接字,能夠經過網絡也能夠在本機進行通訊,它的好處在於能夠跨主機進行通訊。

總結

總的來講,進程是程序在一個數據集上的一次執行過程,它就是程序運行起來的表現。這是咱們學習多線程的開篇,但願經過這篇文章,讓你們簡單地瞭解進程是什麼,後面咱們再來深刻了解多線程。

推薦閱讀

設計模式看了又忘,忘了又看?

公衆號後臺回覆『設計模式』能夠獲取《一故事一設計模式》電子書

以爲文章有用幫忙轉發&點贊,多謝朋友們!

LieBrother
相關文章
相關標籤/搜索