在HTML中,當客戶填寫了表單,並按下了發送(submit)按鈕後,表單的內容被髮送 到了服務器端,通常的,這時就須要有一個服務器端腳原本對錶單的內容進行一些處理, 或者是把它們保存起來,或者是按內容進行一些查詢,或者是一些別的什麼。沒有了CGI, WEB的世界就徹底失去了它的交互性,全部的信息都變成單向的了,而不可以有任何的反饋 。 javascript
有的人認爲能夠用java script來代替CGI程序,這實際上是一個概念上的錯誤。javascript只可以在客戶瀏覽器中運行,而CGI倒是工做在服務器上的。他們所作的工做有一些 交集,好比表單數據驗證一類的,可是java script是絕對沒法取代CGI的。但能夠這樣說 ,若是一項工做即可以用java script來作,又能夠用CGI來作,那麼絕對要使用javascript,在執行的速度上,java script比CGI有着先天的優點。只有那些在客戶端解決不了的問題,好比和某個遠程數據庫交互,這時就應該使用CGI了。html
簡單的說來,CGI是用來溝通HTML表單和服務器端程序的接口(interface)。說它是 接口,也就是說CGI並非一種語言,而是能夠被其餘語言所應用的一個規範集。理論上講 ,你能夠用任何的程序語言來編寫CGI程序,只要在編程的時候符合CGI規範所定義的一些 東西就能夠了。因爲C語言在平臺無關性上表現不錯(幾乎在任何的系統平臺下都有其相應 編譯器),並且對大多數程序員而言都算得上很熟悉(不像Perl),所以,C是CGI編程的 首選語言之一。這兒咱們介紹的,就是如何使用C來編寫CGI程序。java
做爲CGI編程的最爲簡單的例子,就是進行表單的處理。於是在這篇文章中,咱們主 要介紹的就是如何用C來編寫CGI程序來進行表但處理。c++
GET表單的處理程序員
對於那些使用了屬性「METHOD=GET」的表單(或者沒有METHOD屬性,這時候GET是其 缺省值),CGI定義爲:當表單被髮送到服務器斷後,表單中的數據被保存在服務器上一個 叫作QUERY_STRING的環境變量中。這種表單的處理相對簡單,只要讀取環境變量就能夠了 。這一點對不一樣的語言有不一樣的作法。在C語言中,你能夠用庫函getenv(定義在標準庫 函數stdlib中)來把環境變量的值做爲一個字符串來存取。你能夠在取得了字符串中的數 據後,運用一些小技巧進行類型的轉換,這都是比較簡單的了。在CGI程序中的標準輸出( output)(好比在C中的stdout文件流)也是通過重定義了的。它並無在服務器上產生任 何的輸出內容,而是被重定向到客戶瀏覽器。這樣,若是編寫一個C的CGI程序的時候,把 一個HTML文檔輸出到它的stdout上,這個HTML文檔會被在客戶端的瀏覽器中顯示出來。這 也是CGI程序的一個基本原理。 咱們來看看具體的程序實現,下面是一段HTML表單:數據庫
< form ACTION="/cgi-bin/mult.cgi" >編程
< P >請在下面填入乘數和被乘數,按下肯定後能夠看到結果。
< INPUT NAME="m" SIZE="5" >
< INPUT NAME="n" SIZE="5" >< BR >
< INPUT TYPE="SUBMIT" values="肯定" >
< /form >
咱們要實現的功能很簡單,就是把表單中輸入的數值乘起來,而後輸出結果。其實這 個功能徹底能夠用java script來實現,但爲了讓程序儘可能的簡單易懂,我仍是選擇了這個 小小的乘法來做爲示例。 瀏覽器
下面就是處理這個表單的CGI程序,對應於form標籤中的ACTION屬性值。 服務器
#include < stdio.h >
#include < stdlib.h >
int main(void)
{
char *data;
long m,n;
printf("%s%c%c ","Content-Type:text/html;charset=gb2312",13,10);
printf("< TITLE >乘法結果< /TITLE > ");
printf("< H3 >乘法結果< /H3 > ");
data = getenv("QUERY_STRING");
if(data == NULL)
printf("< P >錯誤!數據沒有被輸入或者數據傳輸有問題");
else if(sscanf(data,"m=%ld&n=%ld",&m,&n)!=2)
printf("< P >錯誤!輸入數據非法。表單中輸入的必須是數字。");
else
printf("< P >%ld和%ld的成績是:%ld。",m,n,m*n);
return 0;
} 編程語言
具體的C語法就很少講了,咱們來看看它做爲CGI程序所特殊的地方。
前面已經提到標準輸出的內容就是要被顯示在瀏覽器中的內容。第一行的輸出內容是 必須的,也是一個CGI程序所特有的:printf("%s%c%c ","Content-Type:text/html",13, 10),這個輸出是做爲HTML的文件頭。由於CGI不只能夠像瀏覽器輸出HTML文本,並且能夠 輸出圖像,聲音之類的東西。這一行告訴瀏覽器如何處理接受到的內容。在Content-Type 的定義後面跟有兩行的空行,這也是不可缺乏的。由於全部CGI程序的頭部輸出都是相近的 ,於是能夠爲其定義一個函數,來節省編程的時間。這是CGI編程經常使用的一個技巧。
程序在後面調用了用了庫函數getevn來獲得QUERY_STRING的內容,而後使用sscanf函 數把每一個參數值取出來,要注意的是sscanf函數的用法。其餘的就沒有什麼了,和通常的C程序沒有區別。
把程序編譯後,更名爲mult.cgi放在/cgi-bin/目錄下面,就能夠被表單調用了。這樣,一個處理GET方式表單的CGI程序就大功告成了。
POST表單處理
下面咱們來考慮另一種表單傳送方法:POST。假設咱們要實現的任務是這樣的:把 表單中客戶輸入的一段文本內容添加到服務器上的一個文本文件的後面。這能夠看做是一 個留言版程序的雛形。顯然,這個工做是沒法用java script這種客戶端腳原本實現,也算
得上真正意義上的CGI程序了。
看起來這個問題和上面講的內容很相近,僅僅是用不一樣的表單和不一樣的腳本(程序) 而已。但實際上,這中間是有一些區別的。在上面的例子中,GET的處理方法能夠看做是「 純查詢(pure query)」類型的,也就是說,它與狀態無關。一樣的數據能夠被提交任意 的次數,而不會引發任何的問題(除了服務器的一些小小的開銷)。可是如今的任務就不 同了,至少它要改變一個文件的內容。於是,能夠說它是與狀態有關的。這也算是POST和 GET的區別之一。並且,GET對於表單的長度是有限制的,而POST則否則,這也是在這個任 務中選用POST方法的主要緣由。但相對的,對GET的處理速度就要比POST快一些。
在CGI的定義中,對於POST類型的表單,其內容被送到CGI程序的標準輸入(在C語言 中是stdin),而被傳送的長度被放在環境變量CONTENT_LENGTH中。於是咱們要作的就是, 在標準輸入中讀入CONTENT_LENGTH長度的字符串。從標準輸出讀入數據聽起來彷佛要比從 環境變量中讀數據來的要容易一些,其實則否則,有一些細節地方要注意,這在下面的程序 中能夠看到。特別要注意的一點就是:CGI程序和通常的程序有所不一樣,通常的程序在讀完 了一個文件流的內容以後,會獲得一個EOF的標誌。但在CGI程序的表單處理過程當中,EOF是永遠不會出現的,因此千萬不要讀多於CONTENT_LENGTH長度的字符,否這會有什麼後果,誰也不知道(CGI規範中沒有定義,通常根據服務器不一樣而有不一樣得處理方法)。
咱們來看看到底如何從POST表單收集數據到CGI程序,下面給出了一個比較簡單的C源
代碼:
#include < stdio.h >
#include < stdlib.h >
#define MAXLEN 80
#define EXTRA 5
/* 4個字節留給字段的名字"data", 1個字節留給"=" */
#define MAXINPUT MAXLEN+EXTRA+2
/* 1個字節留給換行符,還有一個留給後面的NULL */
#define DATAFILE "../data/data.txt"
/* 要被添加數據的文件 */
void unencode(char *src, char *last, char *dest)
{
for(; src != last; src++, dest++)
if(*src == "+")
*dest = " ";
else if(*src == "%") {
int code;
if(sscanf(src+1, "%2x", &code) != 1) code = "?";
*dest = code;
src +=2; }
else
*dest = *src;
*dest = " ";
*++dest = "";
}
int main(void)
{
char *lenstr;
char input[MAXINPUT], data[MAXINPUT];
long len;
printf("%s%c%c ",
"Content-Type:text/html;charset=gb2312",13,10);
printf("< TITLE >Response< /TITLE > ");
lenstr = getenv("CONTENT_LENGTH");
if(lenstr == NULL || sscanf(lenstr,"%ld",&len)!=1 || len > MAXLEN)
printf("< P >表單提交錯誤");
else {
FILE *f;
fgets(input, len+1, stdin);
unencode(input+EXTRA, input+len, data);
f = fopen(DATAFILE, "a");
if(f == NULL)
printf("< P >對不起,意外錯誤,不可以保存你的數據 ");
else
fputs(data, f);
fclose(f);
printf("< P >很是感謝,您的數據已經被保存< BR >%s",data);
}
return 0;
}
從本質上來看,程序先從CONTENT_LENGTH環境變量中獲得數據的字長,而後讀取相應 長度的字符串。由於數據內容在傳輸的過程當中是通過了編碼的,因此必須進行相應的解碼 。編碼的規則很簡單,主要的有這幾條:
1. 表單中每一個每一個字段用字段名後跟等號,再接上上這個字段的值來表示,每一個字 段之間的內容用&連結;
2. 全部的空格符號用加號代替,因此在編碼碼段中出現空格是非法的;
3. 特殊的字符好比標點符號,和一些有特定意義的字符如「+」,用百分號後跟其對 應的ACSII碼值來表示。
例如:若是用戶輸入的是:
Hello there!
那麼數據傳送到服務器的時候通過編碼,就變成了data=Hello+there%21 上面的unencode()函數就是用來把編碼後的數據進行解碼的。在解碼完成後,數據被添加到data. txt文件的尾部,並在瀏覽其中回顯出來。
把文件編譯完成後,把它更名爲collect.cgi後放在CGI目錄中就能夠被表單調用了。下面給出了其相應的表單:
< form ACTION="/cgi-bin/collect.cgi" METHOD="POST" >
< P >請輸入您的留言(最多80個字符):< BR >
< INPUT NAME="data" SIZE="60" MAXLENGTH="80" >< BR >
< INPUT TYPE="SUBMIT" values="肯定" >
< /form >
事實上,這個程序只能做爲例子,是不可以正式的使用的。它漏掉了很關鍵的一個問 題:當有多個用戶同時像文件寫入數據是,確定會有錯誤發生。而對於一個這樣的程序而 言,文件被同時寫入的概率是很大的。所以,在比較正式的留言版程序中,都須要作一些更多的考慮,好比加入一個信號量,或者是藉助於一個鑰匙文件等。由於那只是編程的技 巧問題,在這兒就很少說了。
最後,咱們來寫一個瀏覽data.txt文件的的CGI程序,這隻須要把內容輸出到stdout就能夠了:
#include < stdio.h >
#include < stdlib.h >
#define DATAFILE "../data/data.txt"
int main(void)
{
FILE *f = fopen(DATAFILE,"r");
int ch;
if(f == NULL) {
printf("%s%c%c ",
"Content-Type:text/html;charset=gb2312",13,10);
printf("< TITLE >錯誤 < /TITLE > ");
printf("< P >< EM >意外錯誤,沒法打開文件< /EM >"); }
else {
printf("%s%c%c ",
"Content-Type:text/plain",13,10);
while((ch=getc(f)) != EOF)
putchar(ch);
fclose(f); }
return 0;
}
這個程序惟一要注意的是:它並無把data.txt 包裝成HTML格式後再輸出,而是直 接做爲簡單文本(plain text)輸出,這隻要在輸出的頭部用text/plain類型代替text/html就能夠了,瀏覽器會根據Content-Type的類型自動的選擇相應的處理方法。
要觸發這個程序也很簡單,由於沒有數據要輸入,因此只需一個按鈕就能夠搞定了:
< form ACTION="/cgi-bin/viewdata.cgi" >
< P >< INPUT TYPE="SUBMIT" values="察看" >
< /form >
到這兒,一些基本的用C編寫CGI程序的原理就將完了。固然,就憑講的這些內容,還很難編寫出一個好的CGI程序,這須要進一步的學習CGI的規範定義,以及一些其餘的CGI編 程特有的技巧。
這篇文章的目的,也就是要你瞭解一下CGI編程的概念。事實上,如今的一些主流的服務器端腳本編程語言如ASP,PHP,JSP等,都基本上具有了CGI編程的大部分的功能,但他們在使用上的,確實是比不管用什麼語言進行CGI編程都要容易的多。因此在進行服務器 端編程的時候,通常都會首先考慮使用這些腳本編程語言。只有當他們也解決不了,好比 要進行一些更爲底層的編程的時候,纔會用到CGI。