轉自:https://www.cnblogs.com/vamei/archive/2012/09/20/2694466.htmlhtml
做者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!shell
計算機實際上能夠作的事情實質上很是簡單,好比計算兩個數的和,再好比在內存中尋找到某個地址等等。這些最基礎的計算機動做被稱爲指令(instruction)。所謂的程序(program),就是這樣一系列指令的所構成的集合。經過程序,咱們可讓計算機完成複雜的操做。程序大多數時候被存儲爲可執行的文件。這樣一個可執行文件就像是一個菜譜,計算機能夠按照菜譜做出可口的飯菜。
apache
那麼,程序和進程(process)的區別又是什麼呢?bash
進程是程序的一個具體實現。只有食譜沒什麼用,咱們總要按照食譜的指點真正一步步實行,才能作出菜餚。進程是執行程序的過程,相似於按照食譜,真正去作菜的過程。同一個程序能夠執行屢次,每次均可以在內存中開闢獨立的空間來裝載,從而產生多個進程。不一樣的進程還能夠擁有各自獨立的IO接口。函數
操做系統的一個重要功能就是爲進程提供方便,好比說爲進程分配內存空間,管理進程的相關信息等等,就好像是爲咱們準備好了一個精美的廚房。spa
首先,咱們可使用$ps命令來查詢正在運行的進程,好比$ps -eo pid,comm,cmd,下圖爲執行結果:操作系統
(-e表示列出所有進程,-o pid,comm,cmd表示咱們須要PID,COMMAND,CMD信息)firefox
每一行表明了一個進程。每一行又分爲三列。第一列PID(process IDentity)是一個整數,每個進程都有一個惟一的PID來表明本身的身份,進程也能夠根據PID來識別其餘的進程。第二列COMMAND是這個進程的簡稱。第三列CMD是進程所對應的程序以及運行時所帶的參數。線程
(第三列有一些由中括號[]括起來的。它們是內核的一部分功能,被打扮成進程的樣子以方便操做系統管理。咱們沒必要考慮它們。)設計
咱們看第一行,PID爲1,名字爲init。這個進程是執行/bin/init這一文件(程序)生成的。當Linux啓動的時候,init是系統建立的第一個進程,這一進程會一直存在,直到咱們關閉計算機。這一進程有特殊的重要性,咱們會不斷提到它。
實際上,當計算機開機的時候,內核(kernel)只創建了一個init進程。Linux內核並不提供直接創建新進程的系統調用。剩下的全部進程都是init進程經過fork機制創建的。新的進程要經過老的進程複製自身獲得,這就是fork。fork是一個系統調用。進程存活於內存中。每一個進程都在內存中分配有屬於本身的一片空間 (address space)。當進程fork的時候,Linux在內存中開闢出一片新的內存空間給新的進程,並將老的進程空間中的內容複製到新的空間中,此後兩個進程同時運行。
老進程成爲新進程的父進程(parent process),而相應的,新進程就是老的進程的子進程(child process)。一個進程除了有一個PID以外,還會有一個PPID(parent PID)來存儲的父進程PID。若是咱們循着PPID不斷向上追溯的話,總會發現其源頭是init進程。因此說,全部的進程也構成一個以init爲根的樹狀結構。
以下,咱們查詢當前shell下的進程:
root@vamei:~# ps -o pid,ppid,cmd PID PPID CMD 16935 3101 sudo -i 16939 16935 -bash 23774 16939 ps -o pid,ppid,cmd
咱們能夠看到,第二個進程bash是第一個進程sudo的子進程,而第三個進程ps是第二個進程的子進程。
還能夠用$pstree命令來顯示整個進程樹:
init─┬─NetworkManager─┬─dhclient │ └─2*[{NetworkManager}] ├─accounts-daemon───{accounts-daemon} ├─acpid ├─apache2─┬─apache2 │ └─2*[apache2───26*[{apache2}]] ├─at-spi-bus-laun───2*[{at-spi-bus-laun}] ├─atd ├─avahi-daemon───avahi-daemon ├─bluetoothd ├─colord───2*[{colord}] ├─console-kit-dae───64*[{console-kit-dae}] ├─cron ├─cupsd───2*[dbus] ├─2*[dbus-daemon] ├─dbus-launch ├─dconf-service───2*[{dconf-service}] ├─dropbox───15*[{dropbox}] ├─firefox───27*[{firefox}] ├─gconfd-2 ├─geoclue-master ├─6*[getty] ├─gnome-keyring-d───7*[{gnome-keyring-d}] ├─gnome-terminal─┬─bash │ ├─bash───pstree │ ├─gnome-pty-helpe │ ├─sh───R───{R} │ └─3*[{gnome-terminal}]
fork一般做爲一個函數被調用。這個函數會有兩次返回,將子進程的PID返回給父進程,0返回給子進程。實際上,子進程總能夠查詢本身的PPID來知道本身的父進程是誰,這樣,一對父進程和子進程就能夠隨時查詢對方。
一般在調用fork函數以後,程序會設計一個if選擇結構。當PID等於0時,說明該進程爲子進程,那麼讓它執行某些指令,好比說使用exec庫函數(library function)讀取另外一個程序文件,並在當前的進程空間執行 (這其實是咱們使用fork的一大目的: 爲某一程序建立進程);而當PID爲一個正整數時,說明爲父進程,則執行另一些指令。由此,就能夠在子進程創建以後,讓它執行與父進程不一樣的功能。
當子進程終結時,它會通知父進程,並清空本身所佔據的內存,並在內核裏留下本身的退出信息(exit code,若是順利運行,爲0;若是有錯誤或異常情況,爲>0的整數)。在這個信息裏,會解釋該進程爲何退出。父進程在得知子進程終結時,有責任對該子進程使用wait系統調用。這個wait函數能從內核中取出子進程的退出信息,並清空該信息在內核中所佔據的空間。可是,若是父進程早於子進程終結,子進程就會成爲一個孤兒(orphand)進程。孤兒進程會被過繼給init進程,init進程也就成了該進程的父進程。init進程負責該子進程終結時調用wait函數。
固然,一個糟糕的程序也徹底可能形成子進程的退出信息滯留在內核中的情況(父進程不對子進程調用wait函數),這樣的狀況下,子進程成爲殭屍(zombie)進程。當大量殭屍進程積累時,內存空間會被擠佔。
儘管在UNIX中,進程與線程是有聯繫但不一樣的兩個東西,但在Linux中,線程只是一種特殊的進程。多個線程之間能夠共享內存空間和IO接口。因此,進程是Linux程序的惟一的實現方式。
程序,進程,PID,內存空間
子進程,父進程,PPID,fork, wait