用 c 寫 CGI 程序簡要指南

文章摘要
  CGI規定了Web服務器調用其餘可執行程序(CGI程 序)的接口協議標準。Web服務器經過調用CGI程序實現和Web瀏覽器的交互。CGI程序能夠用任何程序設計語言編寫,如Shell腳本語言、Perl、Fortran、Pascal、C語言等。可是用C語言編寫的CGI程序具備執行速度快、安全性高等特色。本文詳細分析了用C語言進行CGI程序設計的方法、過程和技巧。 

正文: 用C語言進行CGI程序設計   

1、CGI概述 

  CGI(Common Gateway Interface: 公用網關接口)規定了Web服務器調用其餘可執行程序(CGI程 序)的接口協議標準。Web服務器經過調用CGI程序實現和Web瀏覽器的交互,也就是CGI程序接受Web瀏覽器發送給Web服務器的信息,進行處理,將響應結果再回送給Web服務器及Web瀏覽器。CGI程序通常完成Web網頁中表單(Form)數據的處理、數據庫查詢和實現與傳統應用系統的集成等工做。CGI程序能夠用任何程序設計語言編寫,如Shell腳本語言、Perl、Fortran、Pascal、C語言等。可是用C語言編寫的CGI程序具備執行速度快、安全性高(由於C語言程序是編譯執行且不可被修改)等特色。 

  CGI接口標準包括標準輸入、環境變量、標準輸出三部分。 
  1.標準輸入 
  CGI程序像其餘可執行程序同樣,可經過標準輸入(stdin)從Web服務器獲得輸入信息,如Form中的數據,這就是所謂的向CGI程序傳遞數據的POST方法。這意味着在操做系統命令行狀態可執行CGI程序,對CGI程序進行調試。POST方法是經常使用的方法,本文將以此方法爲例,分析CGI程序設計的方法、過程和技巧。 

  2.環境變量 
操做系統提供了許多環境變量,它們定義了程序的執行環境,應用程序能夠存取它們。Web服務器和CGI接口又另外設置了本身的一些環境變量,用來向CGI程序傳遞一些重要的參數。CGI的GET方法還經過 環境變量QUERY-STRING向CGI程序傳遞Form中的數據。 

  3.標準輸出 
  CGI程序經過標準輸出(stdout)將輸出信息傳送給Web服務器。傳送給Web服務器的信息能夠用各類格式,一般是以純文本或者HTML文本的形式,這樣咱們就能夠在命令行狀態調試CGI程序,而且獲得它們的輸出。 

  下面是一個簡單的CGI程序,它將HTML中Form的信息直接輸出到We b瀏覽器。 html

  # include 
  # include 
  main() 
  { 
  int i , n ; 
  printf (″Content type: text/plain\n\n″); 
  n=0; 
  if(getenv(″CONTENT-LENGTH″)) 
  n=atoi(getenv(CONTENT-LENGTH″)); 
  for (i=0;i<n;i++) <br="">  putchar(getchar()); 
  putchar (′\n′); 
  fflush(stdout); 
  }git



  下面對此程序做一下簡要的分析。 數據庫

  prinft (″Content type :text/plain\n\n″);瀏覽器


  此行經過標準輸出將字符串″Content type :text/plain\n\n″傳送給Web服務器。它是一個MIME頭信息,它告訴Web服務器隨後的輸出是以純ASCII文本的形式。請注意在這個頭信息中有兩個新行符,這是由於Web服務器須要在實際的文本信息開始以前先看見一個空行。 安全

  if (getenv(″CONTENT-LENGTH″)) 
  n=atoi (getenv(″CONTENT-LENGTH″));服務器


  此行首先檢查環境變量CONTENT-LENGTH是否存在。Web服務器在調用使用POST方法的CGI程序時設置此環境變量,它的文本值表示Web服務器傳送給CGI程序的輸入中的字符數目,所以咱們使用函數atoi() 將此環境變量的值轉換成整數,並賦給變量n。請注意Web服務器並不以文件結束符來終止它的輸出,因此若是不檢查環境變量CONTENT-LENGTH,CGI程序就沒法知道何時輸入結束了。 併發

  for (i=0;i<n;i++) <br="">  putchar(getchar());app


  此行從0循環到(CONTENT-LENGTH-1)次將標準輸入中讀到的每個字符直接拷貝到標準輸出,也就是將全部的輸入以ASCII的形式回送給Web服務器。 
  經過此例,咱們可將CGI程序的通常工做過程總結爲以下幾點。 
  1.經過檢查環境變量CONTENT-LENGTH,肯定有多少輸入; 
  2.循環使用getchar()或者其餘文件讀函數獲得全部的輸入; 
  3.以相應的方法處理輸入; 
  4.經過″Contenttype:″頭信息,將輸出信息的格式告訴Web服務器; 
  5.經過使用printf()或者putchar()或者其餘的文件寫函數,將輸出傳送給Web服務器。 
  總之,CGI程序的主要任務就是從Web服務器獲得輸入信息,進行處理,而後將輸出結果再送回給Web服務器。 


2、環境變量 

  環境變量是文本串(名字/值對),能夠被OS Shell或其餘程序設置 ,也能夠被其餘程序訪問。它們是Web服務器傳遞數據給CGI程序的簡單手段,之因此稱爲環境變量是由於它們是全局變量,任何程序均可以存取它們。 

  下面是CGI程序設計中經常要用到的一些環境變量。 
  HTTP-REFERER:調用該CGI程序的網頁的URL。 
  REMOTE-HOST:調用該CGI程序的Web瀏覽器的機器名和域名。 
  REQUEST-METHOD:指的是當Web服務器傳遞數據給CGI程序時所採用的方法,分爲GET和POST兩種方法。GET方法僅經過環境變量(如QUERY-STRING)傳遞數據給CGI程序,而POST方法經過環境變量和標準輸入傳遞數據給CGI程序,所以POST方法可較方便地傳遞較多的數據給CGI程序。 

  SCRIPT-NAME:該CGI程序的名稱。 
  QUERY-STRING:當使用POST方法時,Form中的數據最後放在QUERY-STRING中,傳遞給CGI程序。 
  CONTENT-TYPE:傳遞給CGI程序數據的MIME類型,一般爲″applica tion/x-www-form-url encodede″,它是從HTML Form中以POST方法傳遞數據給CGI程序的數據編碼類型,稱爲URL編碼類型。 
  CONTENT-LENGTH:傳遞給CGI程序的數據字符數(字節數)。 
  在C語言程序中,要訪向環境變量,可以使用getenv()庫函數。例如: 函數

  if (getenv (″CONTENT-LENGTH″)) 
   n=atoi(getenv (″CONTENT-LENGTH″));編碼


  請注意程序中最好調用兩次getenv():第一次檢查是否存在該環境變量,第二次再使用該環境變量。這是由於函數getenv()在給定的環境變量名不存在時,返回一個NULL(空)指針,若是你不首先檢查而直接引用它,當該環境變量不存在時會引發CGI程序崩潰。 

 


3、From輸入的分析和解碼 

  1.分析名字/值對 
  當用戶提交一個HTML Form時,Web瀏覽器首先對Form中的數據以名字/值對的形式進行編碼,併發送給Web服務器,而後由Web服務器傳遞給CGI程序。其格式以下: 
  name1=value1&name2=value2&name3=value3&name4=value4&... 
  其中名字是Form中定義的INPUT、SELECT或TEXTAREA等標置(Tag)名字,值是用戶輸入或選擇的標置值。這種格式即爲URL編碼,程序中須要對其進行分析和解碼。要分析這種數據流,CGI程序必須首先將數據流分解成一組組的名字/值對。這能夠經過在輸入流中查找下面的兩個字符來完成。 
  每當找到字符=,標誌着一個Form變量名字的結束;每當找到字符& ,標誌着一個Form變量值的結束。請注意輸入數據的最後一個變量的值不以&結束。 
  一旦名字/值對分解後,還必須將輸入中的一些特殊字符轉換成相應的ASCII字符。這些特殊字符是: 
  +:將+轉換成空格符; 
  %xx:用其十六進制ASCII碼值表示的特殊字符。根據值xx將其轉換成相應的ASCII字符。 
  對Form變量名和變量值都要進行這種轉換。下面是一個對Form數據進行分析並將結果回送給Web服務器的CGI程序。 

  #include 
  #include 
  #include 
  int htoi(char *); 
  main() 
  { 
   int i,n; 
  char c; 
  printf (″Contenttype: text/plain\n\n″); 
  n=0; 
  if (getenv(″CONTENT-LENGTH″)) 
   n=atoi(getenv(″CONTENT-LENGTH″)); 
  for (i=0; i<n;i++){ <br="">   int is-eq=0; 
  c=getchar(); 
  switch (c){ 
   case ′&′: 
    c=′\n′; 
    break; 
   case ′+′: 
    c=′ ′; 
    break; 
   case ′%′:{ 
    char s[3]; 
    s[0]=getchar(); 
    s[1]=getchar(); 
    s[2]=0; 
    c=htoi(s); 
    i+=2; 
   } 
   break; 
  case ′=′: 
   c=′:′; 
   is-eq=1; 
   break; 
  }; 
  putchar(c); 
  if (is-eq) putchar(′ ′); 
  } 
  putchar (′\n′); 
  fflush(stdout); 
  } 
  /* convert hex string to int */ 
  int htoi(char *s) 
  { 
   char *digits=″0123456789ABCDEF″; 
  if (islower (s[0])) s[0]=toupper(s[0]); 
  if (islower (s[1])) s[1]=toupper(s[1]); 
  return 16 * (strchr(digits, s[0]) -strchr (digits,′0′) 

  +(strchr(digits,s[1])-strchr(digits,′0′)); 
  }


  上面的程序首先輸出一個MIME頭信息給Web服務器,檢查輸入中的字符數,並循環檢查每個字符。當發現字符爲&時,意味着一個名字/值對的結束,程序輸出一個空行;當發現字符爲+時,將它轉換成空格; 當發現字符爲%時,意味着一個兩字符的十六進制值的開始,調用htoi()函數將隨後的兩個字符轉換爲相應的ASCII字符;當發現字符爲=時,意味着一個名字/值對的名字部分的結束,並將它轉換成字符:。最後將轉換後的字符輸出給Web服務器。 


4、產生HTML輸出 

  CGI程序產生的輸出由兩部分組成:MIME頭信息和實際的信息。兩部分之間以一個空行分開。咱們已經看到怎樣使用MIME頭信息″Content type :text/plain\n\n″和printf()、put char()等函數調用來輸 出純ASCII文本給Web服務器。實際上,咱們也可使用MIME頭信息″Content type :text/html\n\n″來輸出HTML源代碼給Web服務器。請注意任何MIME頭信息後必須有一個空行。一旦發送這個MIME頭信息給We b服務器後,Web瀏覽器將認爲隨後的文本輸出爲HTML源代碼,在HTML源代碼中可使用任何HTML結構,如超鏈、圖像、Form,及對其餘CGI程 序的調用。也就是說,咱們能夠在CGI程序中動態產生HTML源代碼輸出 ,下面是一個簡單的例子。 

  #include 
  #include 
  main() 
  { 
   printf(″Contenttype:text/html\n\n″); 
  printf(″<html>\n″); 

  printf(″<head><title>An HTML Page From a CGI</title></head>\n″); 

  printf(″<body><br>\n″); 

  printf(″<h2> This is an HTML page generated from with i n a CGI program.. .</h2>\n″); 

  printf(″<hr><p>\n″); 

  printf(″<a href="../output.html#two"><b> Go back to output.html page </b></a>\n″); 

  printf(″</body>\n″); 

  printf(″</html>\n″); 

  fflush(stdout); 

  }


  上面的CGI程序簡單地用printf()函數來產生HTML源代碼。請注意在輸出的字符串中若是有雙引號,在其前面必須有一個後斜字符\, 這是由於整個HTML代碼串已經在雙引號內,因此HTML代碼串中的雙引號符必須用一個後斜字符\來轉義。 

5、結束語 

  本文詳細分析了用C語言進行CGI程序設計的方法、過程和技巧。C語言的CGI程序雖然執行速度快、可靠性高,可是相對於Perl語言來講,C語言缺少強有力的字符串處理能力,所以在實際應用中,應根據需 要和我的愛好來選擇合適的CGI程序設計語言。

出處:http://pcedu.pconline.com.cn/empolder/gj/c/0506/650480_all.html#content_page_1

相關文章
相關標籤/搜索