Linux中fork（）函數詳解

時間 2019-11-26

標籤 linux fork 函數詳解欄目 Linux 简体版

原文原文鏈接

 
 Linux中fork（）函數詳解 

 
  1、fork入門知識 

  一個進程，包括代碼、數據和分配給進程的資源。fork（）函數經過系統調用建立一個與原來進程幾乎徹底相同的進程， 

  也就是兩個進程能夠作徹底相同的事，但若是初始參數或者傳入的變量不一樣，兩個進程也能夠作不一樣的事。 

  一個進程調用fork（）函數後，系統先給新的進程分配資源，例如存儲數據和代碼的空間。而後把原來的進程的全部值都 

  複製到新的新進程中，只有少數值與原來的進程的值不一樣。至關於克隆了一個本身。 

  來看一個例子： 

 
   /* 
 *  fork_test.c 
 *  version 1
 */
#include <unistd.h>
#include <stdio.h>

int main ()
{
     pid_t fpid; //fpid表示fork函數返回的值  
    int count = 0;
    fpid = fork();
    if (fpid < 0)
        printf("error in fork!");
    else if (fpid == 0) {
        printf("i am the child process, my process id is %d\n",getpid());
        count++;
    } else {
        printf("i am the parent process, my process id is %d\n",getpid());
        count++;
    }
    printf("統計結果是: %d\n",count);
    return 0;
} 
  

  運行結果是： 

 
      i am the child process, my process id is 5574 
      統計結果是: 1 
      i am the parent process, my process id is 5573 
      統計結果是: 1 
 

  在語句fpid=fork()以前，只有一個進程在執行這段代碼，但在這條語句以後，就變成兩個進程在執行了，這兩個進程的幾乎徹底相同， 

  將要執行的下一條語句都是if(fpid<0)…… 

  爲何兩個進程的fpid不一樣呢，這與fork函數的特性有關。 

 
 fork調用的一個奇妙之處就是它僅僅被調用一次，卻可以返回兩次，它可能有三種不一樣的返回值： 

 
  1）在父進程中，fork返回新建立子進程的進程ID； 

 
  2）在子進程中，fork返回0； 

 
  3）若是出現錯誤，fork返回一個負值； 

  在fork函數執行完畢後，若是建立新進程成功，則出現兩個進程，一個是子進程，一個是父進程。在子進程中，fork函數返回0，在父進程中， 

  fork返回新建立子進程的進程ID。咱們能夠經過fork返回的值來判斷當前進程是子進程仍是父進程。 

  解釋fpid的值爲何在父子進程中不一樣。「其實就至關於鏈表，進程造成了鏈表，父進程的fpid(p 意味point)指向子進程的進程id, 

  由於子進程沒有子進程，因此其fpid爲0. 

  fork出錯可能有兩種緣由： 

  1）當前的進程數已經達到了系統規定的上限，這時errno的值被設置爲EAGAIN。 

  2）系統內存不足，這時errno的值被設置爲ENOMEM。 

  建立新進程成功後，系統中出現兩個基本徹底相同的進程，這兩個進程執行沒有固定的前後順序，哪一個進程先執行要看系統的進程調度策略。 

  每一個進程都有一個獨特（互不相同）的進程標識符（process ID），能夠經過getpid（）函數得到，還有一個記錄父進程id的變量，能夠經過getppid（）函數得到變量的值。 

  fork執行完畢後，出現兩個進程 

  兩個進程的內容徹底同樣，怎麼打印的結果不同，那是由於判斷條件的緣由，上面列舉的只是進程的代碼和指令，但還有變量。 

  執行完fork後，進程1的變量爲count=0，fpid！=0（父進程）。進程2的變量爲count=0，fpid=0（子進程），這兩個進程的變量都是獨立的， 

  存在不一樣的地址中，不是共用的，這點要注意。能夠說，咱們就是經過fpid來識別和操做父子進程的。 

  還可能疑惑爲何不是從#include處開始複製代碼的，這是由於fork是把進程當前的狀況拷貝一份，執行fork時，進程已經執行完了int count=0; 

  fork只拷貝下一個要執行的代碼到新的進程。 

 
 2、fork進階知識 

  代碼： 

 
    /* 
 *  fork_test.c 
 *  version 2
 */
#include <unistd.h>
#include <stdio.h>

int main(void)
{
   int i=0;
   printf("i son/pa ppid pid  fpid\n");
   //ppid指當前進程的父進程pid  
   //pid指當前進程的pid,  
   //fpid指fork返回給當前進程的值  
   for(i=0;i<2;i++){
       pid_t fpid=fork();
       if(fpid==0)
           printf("%d child  %4d %4d %4d\n",i,getppid(),getpid(),fpid);
       else
           printf("%d parent %4d %4d %4d\n",i,getppid(),getpid(),fpid);
   }
   return 0;
} 
  

  運行結果是： 

 
      i son/pa ppid pid fpid 
parent 2043 3224 3225 
child 3224 3225 0 
parent 2043 3224 3226 
parent 3224 3225 3227 
child 1 3227 0 
child 1 3226 0 
 

  分析一下： 

  第一步：在父進程中，指令執行到for循環中，i=0，接着執行fork，fork執行完後，系統中出現兩個進程，分別是p3224和p3225 

  （後面用pxxxx表示進程id爲xxxx的進程）。能夠看到父進程p3224的父進程是p2043，子進程p3225的父進程正好是p3224。用一個鏈表來表示這個關係： 

  p2043->p3224->p3225 

  第一次fork後，p3224（父進程）的變量爲i=0，fpid=3225（fork函數在父進程中返回子進程id），代碼內容爲： 

 
   for(i=0;i<2;i++){
    pid_t fpid=fork();//執行完畢，i=0，fpid=3225  
    if(fpid==0)
       printf("%d child  %4d %4d %4d\n",i,getppid(),getpid(),fpid);
    else
       printf("%d parent %4d %4d %4d\n",i,getppid(),getpid(),fpid);
} 
  

  p3225（子進程）的變量爲i=0，fpid=0（fork函數在子進程中返回0），代碼內容爲： 

 
   for(i=0;i<2;i++){
    pid_t fpid=fork();//執行完畢，i=0，fpid=0  
    if(fpid==0)
       printf("%d child  %4d %4d %4d\n",i,getppid(),getpid(),fpid);
    else
       printf("%d parent %4d %4d %4d\n",i,getppid(),getpid(),fpid);
} 
  

  因此打印出結果： 

 
parent 2043 3224 3225 
child 3224 3225 0

  第二步：假設父進程p3224先執行，當進入下一個循環時，i=1，接着執行fork，系統中又新增一個進程p3226，對於此時的父進程， 

  p2043->p3224（當前進程）->p3226（被建立的子進程）。 

  對於子進程p3225，執行完第一次循環後，i=1，接着執行fork，系統中新增一個進程p3227，對於此進程，p3224->p3225（當前進程）->p3227（被建立的子進程）。 

  從輸出能夠看到p3225原來是p3224的子進程，如今變成p3227的父進程。父子是相對的。只要當前進程執行了fork，該進程就變成了父進程了，就打印出了parent。 

  因此打印出結果是： 

 
parent 2043 3224 3226 
parent 3224 3225 3227

  第三步：第二步建立了兩個進程p3226，p3227，這兩個進程執行完printf函數後就結束了，由於這兩個進程沒法進入第三次循環，沒法fork，該執行return 0;了，其餘進程也是如此。 

  如下是p3226，p3227打印出的結果： 

 
child 1 3227 0 
child 1 3226 0

  注意：p3226，p3227的父進程難道不應是p3224和p3225嗎，怎麼會是1呢？這裏關係到進程的建立和死亡的過程， 

  在p3224和p3225執行完第二個循環後，main函數就該退出了，也即進程該死亡了，由於它已經作完全部事情了。p3224和p3225死亡後， 

  p3226，p3227就沒有父進程了，這在操做系統是不被容許的，因此p3226，p3227的父進程就被置爲p1了，p1是永遠不會死亡的。 

  總結一下，這個程序執行的流程以下： 

  這個程序最終產生了3個子進程，執行過6次printf（）函數。 

  再來看一份代碼： 

 
   /* 
 *  fork_test.c 
 *  version 3
 */
#include <unistd.h>
#include <stdio.h>

int main(void)
{
   int i=0;
   for(i=0;i<3;i++){
       pid_t fpid=fork();
       if(fpid==0)
           printf("son\n");
       else
           printf("father\n");
   }
   return 0;
} 
  

  它的執行結果是： 

 
      father 
      son 
      father 
      father 
      father 
      father 
      son 
      son 
      father 
      son 
      son 
      son 
      father 
      son  
 

  大概分析： 

 
      for i=0 1 2 
                father     father     father 
                                          son 
                              son       father 
                                          son 
                 son       father     father 
                                          son 
                              son       father 
                                          son 
 

  其中每一行分別表明一個進程的運行打印結果。 

  總結一下規律，對於這種N次循環的狀況，執行printf函數的次數爲2*（1+2+4+……+2N-1）次，建立的子進程數爲1+2+4+……+2N-1個。 

  同時，若是想測一下一個程序中到底建立了幾個子進程，最好的方法就是調用printf函數打印該進程的pid，也即調用printf("%d\n",getpid());或者經過printf("+\n"); 

  來判斷產生了幾個進程。經過調用printf("+");來統計建立了幾個進程，這是不穩當的。具體緣由分析： 

  代碼： 

 
   /* 
 *  fork_test.c 
 *  version 4
 */
#include <unistd.h>
#include <stdio.h>

int main() {
    pid_t fpid;//fpid表示fork函數返回的值  
    //printf("fork!");  
    printf("fork!\n");
    fpid = fork();
    if (fpid < 0)
        printf("error in fork!");
    else if (fpid == 0)
        printf("I am the child process, my process id is %d\n", getpid());
    else
        printf("I am the parent process, my process id is %d\n", getpid());
    return 0;
} 
  

  執行結果以下： 

 
      fork! 
      I am the parent process, my process id is 3361 
      I am the child process, my process id is 3362 
 

  若是把語句printf("fork!/n");註釋掉，執行printf("fork!"); 

  則新的程序的執行結果是： 

 
      fork!I am the parent process, my process id is 3298 
      fork!I am the child process, my process id is 3299

  程序的惟一的區別就在於一個\n回車符號，爲何結果會相差這麼大呢？ 

  這跟printf的緩衝機制有關，printf某些內容時，操做系統僅僅是把該內容放到了stdout的緩衝隊列裏,並無實際的寫到屏幕上。 

  可是,只要遇到\n 則會當即刷新stdout,所以就可以馬上打印。 

  運行printf("fork!")後，「fork!」 僅僅被放到了緩衝裏，程序運行到fork時緩衝裏面的「fork!」 被子進程複製。所以在子進程度stdout 

  緩衝裏面就也有了fork! 。因此，最終看到的會是fork! 被printf了2次！！！！ 

  而運行printf("fork! \n")後，「fork!」被當即打印到了屏幕上，以後fork到的子進程裏的stdout緩衝裏不會有fork! 內容。所以看到的結果會是fork! 被printf了1次！！！！ 

  因此說printf("+");不能正確地反應進程的數量。 

  進一步分析fork函數。 

  代碼： 

 
   #include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
   fork();
   fork() && fork() || fork();
   fork();
 
   　　return 0;
} 
  

  問題：不算main這個進程自身，程序到底建立了多少個進程。 

  爲了解答這個問題，先用程序驗證一下，到此有多少個進程。 

 
   #include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
   fork();
   fork() && fork() || fork();
   fork();

　　printf("+\n");

　　return 0;
} 
  

  答案：總共20個進程，除去main進程，還有19個進程。 

  分析一下，爲何是還有19個進程。 

  第一個fork和最後一個fork確定是會執行的。 

  主要在中間3個fork上。 

  這裏須要注意&&和||運算符。 

  A&&B，若是A=0，就沒有必要繼續執行&&B了；A非0，就須要繼續執行&&B。 

  A||B，若是A非0，就沒有必要繼續執行||B了，A=0，就須要繼續執行||B。 

原文（部分修改）： https://blog.csdn.net/jason314/article/details/5640969

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。