問題:子進程父進程哪一個先執行:【轉】關於 fork 和父子進程的理解

關於 fork 和父子進程的理解   (http://blog.163.com/kingore@126/blog/static/8540871920097300284862/)

代碼:
#include <unistd.h> 
#include <sys/types.h> 

main () 

        pid_t pid; 
        pid=fork(); 

        if (pid < 0) 
                printf("error in fork!"); 
        else if (pid == 0) 
                printf("i am the child process, my process id is %d\n",getpid()); 
        else 
                printf("i am the parent process, my process id is %d\n",getpid()); 
}


結果是 
[root@localhost c]# ./a.out 
i am the child process, my process id is 4286 
i am the parent process, my process id is 4285 
-------------------------------------------------------------
Q: 我就想不到爲何兩行都打印出來了,在我想來,無論pid是多少,都應該只有一行纔對html

A: 這裏的if和else不是之前理解的選擇分支。fork後產生的子進程和父進程並行運行的.這種理解是不正確的。if 和 else 仍是選擇分支。 主要的緣由是,fork() 函數調用一次,返回兩次。兩次返回的區別是:子進程的返回值是0,父進程返回值爲新子進程的進程ID。
--------------------------------------------------------------linux

Q: 可是隻有一個pid=fork(); 呀,fork()返回的第二次值在何時賦給pid呢算法

A: pid這個變量是有兩個的, 父進程一個, 子進程一個。app

---------------------------------------------------------------wordpress

要搞清楚fork的執行過程,就必須先講清楚操做系統中的「進程(process)」概念。一個進程,主要包含三個元素: 

o. 一個能夠執行的程序; 
o. 和該進程相關聯的所有數據(包括變量,內存空間,緩衝區等等); 
o. 程序的執行上下文(execution context)。 

不 妨簡單理解爲,一個進程表示的,就是一個可執行程序的一次執行過程當中的一個狀態。操做系統對進程的管理,典型的狀況,是經過進程表完成的。進程表中的每一 個表項,記錄的是當前操做系統中一個進程的狀況。對於單 CPU的狀況而言,每一特定時刻只有一個進程佔用 CPU,可是系統中可能同時存在多個活動的(等待執行或繼續執行的)進程。

一個稱爲「程序計數器(program counter, pc)」的寄存器,指出當前佔用 CPU的進程要執行的下一條指令的位置。 

當 分給某個進程的 CPU時間已經用完,操做系統將該進程相關的寄存器的值,保存到該進程在進程表中對應的表項裏面;把將要接替這個進程佔用 CPU的那個進程的上下文,從進程表中讀出,並更新相應的寄存器(這個過程稱爲「上下文交換(process context switch)」,實際的上下文交換須要涉及到更多的數據,那和fork無關,再也不多說,主要要記住程序寄存器pc指出程序當前已經執行到哪裏,是進程上 下文的重要內容,換出 CPU的進程要保存這個寄存器的值,換入CPU的進程,也要根據進程表中保存的本進程執行上下文信息,更新這個寄存器)。 

好了,有這些概念打底,能夠說fork了。當你的程序執行到下面的語句: 
pid=fork(); 
操 做系統建立一個新的進程(子進程),而且在進程表中相應爲它創建一個新的表項。新進程和原有進程的可執行程序是同一個程序;上下文和數據,絕大部分就是原 進程(父進程)的拷貝,但它們是兩個相互獨立的進程!此時程序寄存器pc,在父、子進程的上下文中都聲稱,這個進程目前執行到fork調用即將返回(此時 子進程不佔有CPU,子進程的pc不是真正保存在寄存器中,而是做爲進程上下文保存在進程表中的對應表項內)。問題是怎麼返回,在父子進程中就分道揚鑣。 

父進程繼續執行,操做系統對fork的實現,使這個調用在父進程中返回剛剛建立的子進程的pid(一個正整數),因此下面的if語句中pid<0, pid==0的兩個分支都不會執行。因此輸出i am the parent process... 

子 進程在以後的某個時候獲得調度,它的上下文被換入,佔據 CPU,操做系統對fork的實現,使得子進程中fork調用返回0。因此在這個進程(注意這不是父進程了哦,雖然是同一個程序,可是這是同一個程序的另 外一次執行,在操做系統中此次執行是由另一個進程表示的,從執行的角度說和父進程相互獨立)中pid=0。這個進程繼續執行的過程當中,if語句中 pid<0不知足,可是pid==0是true。因此輸出i am the child process... 

我想你比較困惑的就是,爲何看上去程序中互斥的兩個分支都被執行了。在一個程序的一次執行中,這固然是不可能的;可是你看到的兩行輸出是來自兩個進程,這兩個進程來自同一個程序的兩次執行。 

個人天,不知道說明白了沒……函數

--------------------------------------------------------------------------------spa

到底哪一個進程執行在先,這個和操做系統的調度算法等等不少因素相關。我以爲理解上的困難,關鍵在於爲何會有兩個輸出,而不是誰先誰後。操作系統

-------------------------------------------------------------------------------.net

fork 以後,操做系統會複製一個與父進程徹底相同的子進程,雖然說是父子關係,可是在操做系統看來,他們更像兄弟關係,這2個進程共享代碼空間,可是數據空間是互 相獨立的,子進程數據空間中的內容是父進程的完整拷貝,指令指針也徹底相同,但只有一點不一樣,若是fork成功,子進程中fork的返回值是0,父進程中 fork的返回值是子進程的進程號,若是fork不成功,父進程會返回錯誤。 
能夠這樣想象,2個進程一直同時運行,並且步調一致,在fork以後,他們分別做不一樣的工做,也就是分岔了。這也是fork爲何叫fork的緣由。 
至於那一個最早運行,可能與操做系統有關,並且這個問題在實際應用中並不重要,若是須要父子進程協同,能夠經過原語的辦法解決。unix

 

 

 

****************************************************************************************************************************

 

linux中fork函數及子進程父進程進程前後(http://blog.csdn.net/wu_zf/article/details/7640970)

1、fork入門知識

     一個進程,包括代碼、數據和分配給進程的資源。fork()函數經過系統調用建立一個與原來進程幾乎徹底相同的進程,也就是兩個進程能夠作徹底相同的事,但若是初始參數或者傳入的變量不一樣,兩個進程也能夠作不一樣的事。
    一個進程調用fork()函數後,系統先給新的進程分配資源,例如存儲數據和代碼的空間。而後把原來的進程的全部值都複製到新的新進程中,只有少數值與原來的進程的值不一樣。至關於克隆了一個本身。

     咱們來看一個例子:

 

[cpp] view plaincopy

 

  1. /* 
  2.  *  fork_test.c 
  3.  *  version 1 
  4.  *  Created on: 2010-5-29 
  5.  *      Author: wangth 
  6.  */  
  7. #include <unistd.h>  
  8. #include <stdio.h>   
  9. int main ()   
  10. {   
  11.     pid_t fpid; //fpid表示fork函數返回的值  
  12.     int count=0;  
  13.     fpid=fork();   
  14.     if (fpid < 0)   
  15.         printf("error in fork!");   
  16.     else if (fpid == 0) {  
  17.         printf("i am the child process, my process id is %d/n",getpid());   
  18.         printf("我是爹的兒子/n");//對某些人來講中文看着更直白。  
  19.         count++;  
  20.     }  
  21.     else {  
  22.         printf("i am the parent process, my process id is %d/n",getpid());   
  23.         printf("我是孩子他爹/n");  
  24.         count++;  
  25.     }  
  26.     printf("統計結果是: %d/n",count);  
  27.     return 0;  
  28. }  

 

     運行結果是:
    i am the child process, my process id is 5574
    我是爹的兒子
    統計結果是: 1
    i am the parent process, my process id is 5573
    我是孩子他爹
    統計結果是: 1

    在語句fpid=fork()以前,只有一個進程在執行這段代碼,但在這條語句以後,就變成兩個進程在執行了,這兩個進程的幾乎徹底相同,將要執行的下一條語句都是if(fpid<0)……
    爲何兩個進程的fpid不一樣呢,這與fork函數的特性有關。fork調用的一個奇妙之處就是它僅僅被調用一次,卻可以返回兩次,它可能有三種不一樣的返回值:
    1)在父進程中,fork返回新建立子進程的進程ID;
    2)在子進程中,fork返回0;
    3)若是出現錯誤,fork返回一個負值;

    在fork函數執行完畢後,若是建立新進程成功,則出現兩個進程,一個是子進程,一個是父進程。在子進程中,fork函數返回0,在父進程中,fork返回新建立子進程的進程ID。咱們能夠經過fork返回的值來判斷當前進程是子進程仍是父進程。

    引用一位網友的話來解釋fpid的值爲何在父子進程中不一樣。「其實就至關於鏈表,進程造成了鏈表,父進程的fpid(p 意味point)指向子進程的進程id, 由於子進程沒有子進程,因此其fpid爲0.
    fork出錯可能有兩種緣由:
    1)當前的進程數已經達到了系統規定的上限,這時errno的值被設置爲EAGAIN。
    2)系統內存不足,這時errno的值被設置爲ENOMEM。
    建立新進程成功後,系統中出現兩個基本徹底相同的進程,這兩個進程執行沒有固定的前後順序,哪一個進程先執行要看系統的進程調度策略。
    每一個進程都有一個獨特(互不相同)的進程標識符(process ID),能夠經過getpid()函數得到,還有一個記錄父進程pid的變量,能夠經過getppid()函數得到變量的值。
    fork執行完畢後,出現兩個進程,

    有人說兩個進程的內容徹底同樣啊,怎麼打印的結果不同啊,那是由於判斷條件的緣由,上面列舉的只是進程的代碼和指令,還有變量啊。
    執行完fork後,進程1的變量爲count=0,fpid!=0(父進程)。進程2的變量爲count=0,fpid=0(子進程),這兩個進程的變量都是獨立的,存在不一樣的地址中,不是共用的,這點要注意。能夠說,咱們就是經過fpid來識別和操做父子進程的。
    還有人可能疑惑爲何不是從#include處開始複製代碼的,這是由於fork是把進程當前的狀況拷貝一份,執行fork時,進程已經執行完了int count=0;fork只拷貝下一個要執行的代碼到新的進程。

2、fork進階知識

    先看一份代碼:

 

[cpp] view plaincopy

 

  1. /* 
  2.  *  fork_test.c 
  3.  *  version 2 
  4.  *  Created on: 2010-5-29 
  5.  *      Author: wangth 
  6.  */  
  7. #include <unistd.h>  
  8. #include <stdio.h>  
  9. int main(void)  
  10. {  
  11.    int i=0;  
  12.    printf("i son/pa ppid pid  fpid/n");  
  13.    //ppid指當前進程的父進程pid  
  14.    //pid指當前進程的pid,  
  15.    //fpid指fork返回給當前進程的值  
  16.    for(i=0;i<2;i++){  
  17.        pid_t fpid=fork();  
  18.        if(fpid==0)  
  19.            printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  20.        else  
  21.            printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  22.    }  
  23.    return 0;  
  24. }  

 

    運行結果是:
    i son/pa ppid pid  fpid
    0 parent 2043 3224 3225
    0 child  3224 3225    0
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227
    1 child     1 3227    0
    1 child     1 3226    0
 
    這份代碼比較有意思,咱們來認真分析一下:
    第一步:在父進程中,指令執行到for循環中,i=0,接着執行fork,fork執行完後,系統中出現兩個進程,分別是p3224和p3225(後面我都用pxxxx表示進程id爲xxxx的進程)。能夠看到父進程p3224的父進程是p2043,子進程p3225的父進程正好是p3224。咱們用一個鏈表來表示這個關係:
    p2043->p3224->p3225 
    第一次fork後,p3224(父進程)的變量爲i=0,fpid=3225(fork函數在父進程中返向子進程id),代碼內容爲:

 

[c-sharp] view plaincopy

 

  1. for(i=0;i<2;i++){  
  2.     pid_t fpid=fork();//執行完畢,i=0,fpid=3225  
  3.     if(fpid==0)  
  4.        printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  5.     else  
  6.        printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  7. }  
  8. return 0;  

 

    p3225(子進程)的變量爲i=0,fpid=0(fork函數在子進程中返回0),代碼內容爲:

[c-sharp] view plaincopy

  1. for(i=0;i<2;i++){  
  2.     pid_t fpid=fork();//執行完畢,i=0,fpid=0  
  3.     if(fpid==0)  
  4.        printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  5.     else  
  6.        printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  7. }  
  8. return 0;  

 

    因此打印出結果:
    0 parent 2043 3224 3225
    0 child  3224 3225    0

    第二步:假設父進程p3224先執行,當進入下一個循環時,i=1,接着執行fork,系統中又新增一個進程p3226,對於此時的父進程,p2043->p3224(當前進程)->p3226(被建立的子進程)。
    對於子進程p3225,執行完第一次循環後,i=1,接着執行fork,系統中新增一個進程p3227,對於此進程,p3224->p3225(當前進程)->p3227(被建立的子進程)。從輸出能夠看到p3225原來是p3224的子進程,如今變成p3227的父進程。父子是相對的,這個你們應該容易理解。只要當前進程執行了fork,該進程就變成了父進程了,就打印出了parent。
    因此打印出結果是:
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227
 
    第三步:第二步建立了兩個進程p3226,p3227,這兩個進程執行完printf函數後就結束了,由於這兩個進程沒法進入第三次循環,沒法fork,該執行return 0;了,其餘進程也是如此。
    如下是p3226,p3227打印出的結果:
    1 child     1 3227    0
    1 child     1 3226    0
 
    細心的讀者可能注意到p3226,p3227的父進程難道不應是p3224和p3225嗎,怎麼會是1呢?這裏得講到進程的建立和死亡的過程,在p3224和p3225執行完第二個循環後,main函數就該退出了,也即進程該死亡了,由於它已經作完全部事情了。p3224和p3225死亡後,p3226,p3227就沒有父進程了,這在操做系統是不被容許的,因此p3226,p3227的父進程就被置爲p1了,p1是永遠不會死亡的,至於爲何,這裏先不介紹,留到「3、fork高階知識」講。
    總結一下,這個程序執行的流程以下:

     這個程序最終產生了3個子進程,執行過6次printf()函數。
    咱們再來看一份代碼:

 

[cpp] view plaincopy

 

  1. /* 
  2.  *  fork_test.c 
  3.  *  version 3 
  4.  *  Created on: 2010-5-29 
  5.  *      Author: wangth 
  6.  */  
  7. #include <unistd.h>  
  8. #include <stdio.h>  
  9. int main(void)  
  10. {  
  11.    int i=0;  
  12.    for(i=0;i<3;i++){  
  13.        pid_t fpid=fork();  
  14.        if(fpid==0)  
  15.            printf("son/n");  
  16.        else  
  17.            printf("father/n");  
  18.    }  
  19.    return 0;  
  20.   
  21. }  

 

     它的執行結果是:
    father
    son
    father
    father
    father
    father
    son
    son
    father
    son
    son
    son
    father
    son 

    這裏就不作詳細解釋了,只作一個大概的分析。
    for        i=0         1           2
              father     father     father
                                        son
                            son       father
                                        son
               son       father     father
                                        son
                            son       father
                                        son
    其中每一行分別表明一個進程的運行打印結果。
    總結一下規律,對於這種N次循環的狀況,執行printf函數的次數爲2*(1+2+4+……+2N-1)次,建立的子進程數爲1+2+4+……+2N-1個。(感謝gao_jiawei網友指出的錯誤,本來個人結論是「執行printf函數的次數爲2*(1+2+4+……+2N)次,建立的子進程數爲1+2+4+……+2N 」,這是錯的)
    網上有人說N次循環產生2*(1+2+4+……+2N)個進程,這個說法是不對的,但願你們須要注意。

    數學推理見http://202.117.3.13/wordpress/?p=81(該博文的最後)。
    同時,你們若是想測一下一個程序中到底建立了幾個子進程,最好的方法就是調用printf函數打印該進程的pid,也即調用printf("%d/n",getpid());或者經過printf("+/n");來判斷產生了幾個進程。有人想經過調用printf("+");來統計建立了幾個進程,這是不穩當的。具體緣由我來分析。
    老規矩,你們看一下下面的代碼:

 

[cpp] view plaincopy

 

  1. /* 
  2.  *  fork_test.c 
  3.  *  version 4 
  4.  *  Created on: 2010-5-29 
  5.  *      Author: wangth 
  6.  */  
  7. #include <unistd.h>  
  8. #include <stdio.h>  
  9. int main() {  
  10.     pid_t fpid;//fpid表示fork函數返回的值  
  11.     //printf("fork!");  
  12.     printf("fork!/n");  
  13.     fpid = fork();  
  14.     if (fpid < 0)  
  15.         printf("error in fork!");  
  16.     else if (fpid == 0)  
  17.         printf("I am the child process, my process id is %d/n", getpid());  
  18.     else  
  19.         printf("I am the parent process, my process id is %d/n", getpid());  
  20.     return 0;  
  21. }  

 

    執行結果以下:
    fork!
    I am the parent process, my process id is 3361
    I am the child process, my process id is 3362 

    若是把語句printf("fork!/n");註釋掉,執行printf("fork!");
    則新的程序的執行結果是:
    fork!I am the parent process, my process id is 3298
    fork!I am the child process, my process id is 3299 

    程序的惟一的區別就在於一個/n回車符號,爲何結果會相差這麼大呢?
    這就跟printf的緩衝機制有關了,printf某些內容時,操做系統僅僅是把該內容放到了stdout的緩衝隊列裏了,並無實際的寫到屏幕上。可是,只要看到有/n 則會當即刷新stdout,所以就立刻可以打印了。
    運行了printf("fork!")後,「fork!」僅僅被放到了緩衝裏,程序運行到fork時緩衝裏面的「fork!」  被子進程複製過去了。所以在子進程度stdout緩衝裏面就也有了fork! 。因此,你最終看到的會是fork!  被printf了2次!!!!
    而運行printf("fork! /n")後,「fork!」被當即打印到了屏幕上,以後fork到的子進程裏的stdout緩衝裏不會有fork! 內容。所以你看到的結果會是fork! 被printf了1次!!!!
    因此說printf("+");不能正確地反應進程的數量。
    你們看了這麼多可能有點疲倦吧,不過我還得貼最後一份代碼來進一步分析fork函數。

[cpp] view plaincopy

  1. #include <stdio.h>  
  2. #include <unistd.h>  
  3. int main(int argc, char* argv[])  
  4. {  
  5.    fork();  
  6.    fork() && fork() || fork();  
  7.    fork();  
  8.    return 0;  
  9. }  

 

    問題是不算main這個進程自身,程序到底建立了多少個進程。
    爲了解決這個問題,咱們先作一下弊,先用程序驗證一下,到此有多少個進程。

 

    總共20個進程,除去main進程,還有19個進程。
    咱們再來仔細分析一下,爲何是還有19個進程。
    第一個fork和最後一個fork確定是會執行的。
    主要在中間3個fork上,能夠畫一個圖進行描述。
    這裏就須要注意&&和||運算符。
    A&&B,若是A=0,就沒有必要繼續執行&&B了;A非0,就須要繼續執行&&B。
    A||B,若是A非0,就沒有必要繼續執行||B了,A=0,就須要繼續執行||B。
    fork()對於父進程和子進程的返回值是不一樣的,照上面的A&&B和A||B的分支進行畫圖,能夠得出5個分支。

 

 

    

     加上前面的fork和最後的fork,總共4*5=20個進程,除去main主進程,就是19個進程了。

3、fork高階知識

        這一塊我主要就fork函數講一下操做系統進程的建立、死亡和調度等。由於時間和精力限制,我先寫到這裏,下次找個時間我爭取把剩下的內容補齊。

參考資料:

 

      http://blog.csdn.net/dog_in_yellow/archive/2008/01/13/2041079.aspx

      http://blog.chinaunix.net/u1/53053/showart_425189.html

      http://blog.csdn.net/saturnbj/archive/2009/06/19/4282639.aspx

      http://www.cppblog.com/zhangxu/archive/2007/12/02/37640.html

      http://www.qqread.com/linux/2010/03/y491043.html

      http://www.yuanma.org/data/2009/1103/article_3998.htm

相關文章
相關標籤/搜索