Linux中fork()函數詳解

Linux中fork()函數詳解
 
1、fork入門知識
 
一個進程,包括代碼、數據和分配給進程的資源。fork()函數經過系統調用建立一個與原來進程幾乎徹底相同的進程,
也就是兩個進程能夠作徹底相同的事,但若是初始參數或者傳入的變量不一樣,兩個進程也能夠作不一樣的事。
 
一個進程調用fork()函數後,系統先給新的進程分配資源,例如存儲數據和代碼的空間。而後把原來的進程的全部值都
複製到新的新進程中,只有少數值與原來的進程的值不一樣。至關於克隆了一個本身。
來看一個例子:
/* 
 *  fork_test.c 
 *  version 1
 */
#include <unistd.h>
#include <stdio.h>

int main ()
{
     pid_t fpid; //fpid表示fork函數返回的值  
    int count = 0;
    fpid = fork();
    if (fpid < 0)
        printf("error in fork!");
    else if (fpid == 0) {
        printf("i am the child process, my process id is %d\n",getpid());
        count++;
    } else {
        printf("i am the parent process, my process id is %d\n",getpid());
        count++;
    }
    printf("統計結果是: %d\n",count);
    return 0;
}
運行結果是:
    i am the child process, my process id is 5574
    統計結果是: 1
    i am the parent process, my process id is 5573
    統計結果是: 1
 
在語句fpid=fork()以前,只有一個進程在執行這段代碼,但在這條語句以後,就變成兩個進程在執行了,這兩個進程的幾乎徹底相同,
將要執行的下一條語句都是if(fpid<0)……
爲何兩個進程的fpid不一樣呢,這與fork函數的特性有關。
fork調用的一個奇妙之處就是它僅僅被調用一次,卻可以返回兩次,它可能有三種不一樣的返回值:
1)在父進程中,fork返回新建立子進程的進程ID;
2)在子進程中,fork返回0;
3)若是出現錯誤,fork返回一個負值;
 
在fork函數執行完畢後,若是建立新進程成功,則出現兩個進程,一個是子進程,一個是父進程。在子進程中,fork函數返回0,在父進程中,
fork返回新建立子進程的進程ID。咱們能夠經過fork返回的值來判斷當前進程是子進程仍是父進程。
解釋fpid的值爲何在父子進程中不一樣。「其實就至關於鏈表,進程造成了鏈表,父進程的fpid(p 意味point)指向子進程的進程id,
由於子進程沒有子進程,因此其fpid爲0.
 
fork出錯可能有兩種緣由:
1)當前的進程數已經達到了系統規定的上限,這時errno的值被設置爲EAGAIN。
2)系統內存不足,這時errno的值被設置爲ENOMEM。
 
建立新進程成功後,系統中出現兩個基本徹底相同的進程,這兩個進程執行沒有固定的前後順序,哪一個進程先執行要看系統的進程調度策略。
每一個進程都有一個獨特(互不相同)的進程標識符(process ID),能夠經過getpid()函數得到,還有一個記錄父進程id的變量,能夠經過getppid()函數得到變量的值。
fork執行完畢後,出現兩個進程
 
 
兩個進程的內容徹底同樣,怎麼打印的結果不同,那是由於判斷條件的緣由,上面列舉的只是進程的代碼和指令,但還有變量。
 
執行完fork後,進程1的變量爲count=0,fpid!=0(父進程)。進程2的變量爲count=0,fpid=0(子進程),這兩個進程的變量都是獨立的,
存在不一樣的地址中,不是共用的,這點要注意。能夠說,咱們就是經過fpid來識別和操做父子進程的。
 
還可能疑惑爲何不是從#include處開始複製代碼的,這是由於fork是把進程當前的狀況拷貝一份,執行fork時,進程已經執行完了int count=0;
fork只拷貝下一個要執行的代碼到新的進程。
 
2、fork進階知識
代碼:
 /* 
 *  fork_test.c 
 *  version 2
 */
#include <unistd.h>
#include <stdio.h>

int main(void)
{
   int i=0;
   printf("i son/pa ppid pid  fpid\n");
   //ppid指當前進程的父進程pid  
   //pid指當前進程的pid,  
   //fpid指fork返回給當前進程的值  
   for(i=0;i<2;i++){
       pid_t fpid=fork();
       if(fpid==0)
           printf("%d child  %4d %4d %4d\n",i,getppid(),getpid(),fpid);
       else
           printf("%d parent %4d %4d %4d\n",i,getppid(),getpid(),fpid);
   }
   return 0;
}
運行結果是:
    i son/pa ppid pid fpid
    0 parent 2043 3224 3225
    0 child 3224 3225 0
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227
    1 child 1 3227 0
    1 child 1 3226 0
 
分析一下:
第一步:在父進程中,指令執行到for循環中,i=0,接着執行fork,fork執行完後,系統中出現兩個進程,分別是p3224和p3225
(後面用pxxxx表示進程id爲xxxx的進程)。能夠看到父進程p3224的父進程是p2043,子進程p3225的父進程正好是p3224。用一個鏈表來表示這個關係:
p2043->p3224->p3225
 
第一次fork後,p3224(父進程)的變量爲i=0,fpid=3225(fork函數在父進程中返回子進程id),代碼內容爲:
for(i=0;i<2;i++){
    pid_t fpid=fork();//執行完畢,i=0,fpid=3225  
    if(fpid==0)
       printf("%d child  %4d %4d %4d\n",i,getppid(),getpid(),fpid);
    else
       printf("%d parent %4d %4d %4d\n",i,getppid(),getpid(),fpid);
}
p3225(子進程)的變量爲i=0,fpid=0(fork函數在子進程中返回0),代碼內容爲:
for(i=0;i<2;i++){
    pid_t fpid=fork();//執行完畢,i=0,fpid=0  
    if(fpid==0)
       printf("%d child  %4d %4d %4d\n",i,getppid(),getpid(),fpid);
    else
       printf("%d parent %4d %4d %4d\n",i,getppid(),getpid(),fpid);
}
因此打印出結果:
    0 parent 2043 3224 3225
    0 child 3224 3225 0
 
第二步:假設父進程p3224先執行,當進入下一個循環時,i=1,接着執行fork,系統中又新增一個進程p3226,對於此時的父進程,
p2043->p3224(當前進程)->p3226(被建立的子進程)。
對於子進程p3225,執行完第一次循環後,i=1,接着執行fork,系統中新增一個進程p3227,對於此進程,p3224->p3225(當前進程)->p3227(被建立的子進程)。
從輸出能夠看到p3225原來是p3224的子進程,如今變成p3227的父進程。父子是相對的。只要當前進程執行了fork,該進程就變成了父進程了,就打印出了parent。
因此打印出結果是:
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227
 
第三步:第二步建立了兩個進程p3226,p3227,這兩個進程執行完printf函數後就結束了,由於這兩個進程沒法進入第三次循環,沒法fork,該執行return 0;了,其餘進程也是如此。
如下是p3226,p3227打印出的結果:
    1 child 1 3227 0
    1 child 1 3226 0
注意:p3226,p3227的父進程難道不應是p3224和p3225嗎,怎麼會是1呢?這裏關係到進程的建立和死亡的過程,
在p3224和p3225執行完第二個循環後,main函數就該退出了,也即進程該死亡了,由於它已經作完全部事情了。p3224和p3225死亡後,
p3226,p3227就沒有父進程了,這在操做系統是不被容許的,因此p3226,p3227的父進程就被置爲p1了,p1是永遠不會死亡的。
 
總結一下,這個程序執行的流程以下:
這個程序最終產生了3個子進程,執行過6次printf()函數。
 
再來看一份代碼:
/* 
 *  fork_test.c 
 *  version 3
 */
#include <unistd.h>
#include <stdio.h>

int main(void)
{
   int i=0;
   for(i=0;i<3;i++){
       pid_t fpid=fork();
       if(fpid==0)
           printf("son\n");
       else
           printf("father\n");
   }
   return 0;
}
它的執行結果是:
    father
    son
    father
    father
    father
    father
    son
    son
    father
    son
    son
    son
    father
    son 
大概分析:
    for i=0 1 2
              father     father     father
                                        son
                            son       father
                                        son
               son       father     father
                                        son
                            son       father
                                        son
其中每一行分別表明一個進程的運行打印結果。
 
總結一下規律,對於這種N次循環的狀況,執行printf函數的次數爲2*(1+2+4+……+2N-1)次,建立的子進程數爲1+2+4+……+2N-1個。
 
同時,若是想測一下一個程序中到底建立了幾個子進程,最好的方法就是調用printf函數打印該進程的pid,也即調用printf("%d\n",getpid());或者經過printf("+\n");
 
來判斷產生了幾個進程。經過調用printf("+");來統計建立了幾個進程,這是不穩當的。具體緣由分析:
代碼:
/* 
 *  fork_test.c 
 *  version 4
 */
#include <unistd.h>
#include <stdio.h>

int main() {
    pid_t fpid;//fpid表示fork函數返回的值  
    //printf("fork!");  
    printf("fork!\n");
    fpid = fork();
    if (fpid < 0)
        printf("error in fork!");
    else if (fpid == 0)
        printf("I am the child process, my process id is %d\n", getpid());
    else
        printf("I am the parent process, my process id is %d\n", getpid());
    return 0;
}
執行結果以下:
    fork!
    I am the parent process, my process id is 3361
    I am the child process, my process id is 3362
若是把語句printf("fork!/n");註釋掉,執行printf("fork!");
則新的程序的執行結果是:
    fork!I am the parent process, my process id is 3298
    fork!I am the child process, my process id is 3299
 
程序的惟一的區別就在於一個\n回車符號,爲何結果會相差這麼大呢?
這跟printf的緩衝機制有關,printf某些內容時,操做系統僅僅是把該內容放到了stdout的緩衝隊列裏,並無實際的寫到屏幕上。
可是,只要遇到\n 則會當即刷新stdout,所以就可以馬上打印。
運行printf("fork!")後,「fork!」 僅僅被放到了緩衝裏,程序運行到fork時緩衝裏面的「fork!」 被子進程複製。所以在子進程度stdout
緩衝裏面就也有了fork! 。因此,最終看到的會是fork! 被printf了2次!!!!
而運行printf("fork! \n")後,「fork!」被當即打印到了屏幕上,以後fork到的子進程裏的stdout緩衝裏不會有fork! 內容。所以看到的結果會是fork! 被printf了1次!!!!
因此說printf("+");不能正確地反應進程的數量。
 
進一步分析fork函數。
代碼:
#include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
   fork();
   fork() && fork() || fork();
   fork();
  return 0;
}
問題:不算main這個進程自身,程序到底建立了多少個進程。
 
爲了解答這個問題,先用程序驗證一下,到此有多少個進程。
#include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
   fork();
   fork() && fork() || fork();
   fork();

  printf("+\n");

  return 0;
}
答案:總共20個進程,除去main進程,還有19個進程。
分析一下,爲何是還有19個進程。
第一個fork和最後一個fork確定是會執行的。
主要在中間3個fork上。
這裏須要注意&&和||運算符。
A&&B,若是A=0,就沒有必要繼續執行&&B了;A非0,就須要繼續執行&&B。
A||B,若是A非0,就沒有必要繼續執行||B了,A=0,就須要繼續執行||B。
 
相關文章
相關標籤/搜索