WebBench壓力測試工具（詳細源碼註釋+分析）

時間 2020-08-10

標籤 webbench 壓力測試工具詳細源碼註釋分析简体版

原文原文鏈接

本文適合人羣：對WebBench實現感興趣的人web

WebBench原理：數組

Linux下使用的服務器壓力測試工具，利用fork創建多個子進程，每一個子進程在測試時間內不斷髮送請求報文，創建多個鏈接，而後由父進程統計：TCP鏈接成功次數，TCP鏈接失敗次數，從服務器接收的數據量緩存

WebBench適用於小，中型網站的服務器壓力測試(對淘寶，百度這種大型網站不存在測壓做用）服務器

WebBench支持的並行鏈接數：32768網絡

進程號pid是short類型的，short類型最大爲32768併發

因此WebBench最多能夠模擬3萬多個併發鏈接去測試網站的負載能力socket

WebBench源碼理解坑點：

1.clients參數tcp

//建立子進程進行測試，子進程數量和clients有關
    for(i=0; i<clients; i++)
    {
        // pid 爲 pid_t 類型 表示進程號

        pid=fork();//創建子進程

        //fork失敗 子進程錯誤
        if(pid <= (pid_t) 0)
        {
            sleep(1);  //當前進程掛起1毫秒，將cpu時間交給其餘進程
            break;     //跳出去，阻止子進程繼續fork
        }
    }

子進程數量=1+2+3+……+(clients)ide

關鍵是的fork函數的理解：fork一個子進程，該子進程將要執行的指令和父進程繼續執行的指令是如出一轍的函數

2.benchtime參數

一個子進程在benchtime時間內，不斷髮送http請求，創建多個鏈接進行測試，到達benchtime時間則中止測試，返回測試結果（鏈接成功次數，鏈接失敗次數，服務器響應內容字節數）

針對原版的WebBench所做的改進：

1.棄用了TRACE請求方法：回顯服務器收到的請求

由於通常服務器都不支持這個方法，支持這個方法的服務器存在跨站腳本漏洞，攻擊者能夠此漏洞欺騙合法用戶並獲得他們的私人信息

2.增長了鏈接失敗類型的統計，結果更加直觀

一共兩個文件socket.c和webbench.c

加上註釋，代碼不超過一千行

sorcket.c:

#include <sys/types.h>
#include <sys/socket.h>
#include <fcntl.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <netdb.h>
#include <sys/time.h>
#include <string.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <stdarg.h>

/*

sockaddr_in分析：

#include <netinet/in.h>和#include <arpa/inet.h>定義的

struct sockaddr
{
    __SOCKADDR_COMMON (sa_);  //協議族

    char sa_data[14];         //地址+端口號
};

sockaddr缺陷：把目標地址和端口號混在一塊兒了
而sockaddr_in就解決了這一缺陷
將端口號和IP地址分開存儲

struct sockaddr_in
{
    sa_family_t sin_family;     //地址族

    uint16_t sin_port;          //16位TCP/UDP端口號

    struct in_addr sin_addr;    //32位IP地址

    char sin_zero[8];           //不使用，只爲了內存對齊
};

*/

/*

hostent分析：
host entry的縮寫
記錄主機信息包括主機名，別名，地址類型，地址長度和地址列表

struct hostent
{

    char *h_name;         //正式主機名

    char **h_aliases;     //主機別名

    int h_addrtype;       //主機IP地址類型：IPV4-AF_INET

    int h_length;          //主機IP地址字節長度，對於IPv4是四字節，即32位

    char **h_addr_list;      //主機的IP地址列表

};
#define h_addr h_addr_list[0]   //保存的是IP地址

主機的的地址是列表形式的緣由：
當一個主機又多個網絡接口時，天然有多個地址

*/

//host        ip地址或者主機名
//clientPort  端口
int Socket(const char *host, int clientPort)
{
    int sock;
    unsigned long inaddr;

    struct sockaddr_in ad;//地址信息
    struct hostent *hp;//主機信息

    /*

    由於host多是ip地址或者主機名
    因此當host爲主機名的時候須要經過主機名獲得IP地址

    */
    //初始化地址
    memset(&ad, 0, sizeof(ad));

    //採用TCP/IP協議族
    ad.sin_family = AF_INET;

    //點分十進制IP轉化爲二進制IP
    inaddr = inet_addr(host);

    //輸入爲IP地址
    if (inaddr != INADDR_NONE)
        //將IP地址複製給ad的sin_addr屬性
        memcpy(&ad.sin_addr, &inaddr, sizeof(inaddr));
    //輸入不是IP地址，是主機名
    else
    {
        //經過主機名獲得主機信息
        hp = gethostbyname(host);

        //沒有獲得主機信息
        if (hp == NULL)
            return -1;
        //將IP地址複製給ad的sin_addr屬性
        memcpy(&ad.sin_addr, hp->h_addr, hp->h_length);
    }

    /*
    將端口號從主機字節順序變成網絡字節順序
    就是整數在地址空間存儲方式變爲高字節存放在內存低字節處

    網絡字節順序是TCP/IP中規定好的一種數據表示格式，與CPU和操做系統無關
    從而能夠保證數據在不一樣主機之間傳輸時可以被正確解釋
    網絡字節順序採用大尾順序：高字節存儲在內存低字節處
    */
    ad.sin_port = htons(clientPort);

    /*
    AF_INET:     IPV4網絡協議
    SOCK_STRAM:  提供面向鏈接的穩定數據傳輸，即TCP協議
    */
    //建立一個採用IPV4和TCP的socket
    sock = socket(AF_INET, SOCK_STREAM, 0);

    //建立socket失敗
    if (sock < 0)
        return sock;

    //創建鏈接 鏈接失敗返回-1
    if (connect(sock, (struct sockaddr *)&ad, sizeof(ad)) < 0)
        return -1;

    //建立成功 返回socket
    return sock;
}

webbench.c

#include "socket.c"
#include <unistd.h>
#include<stdio.h>
#include <sys/param.h>
#include <rpc/types.h>
#include <getopt.h>
#include <strings.h>
#include <time.h>
#include <signal.h>
#include<string.h>
#include<error.h>


//用法和各參數的詳細意義
static void usage(void)
{
    fprintf(stderr,
            "webbench [parameter]... URL\n"
            "  -f|--force               No waiting for server response \n"
            "  -r|--reload              Re-request loading (no caching) \n"
            "  -t|--time <sec>          Set run time in seconds, default 30 seconds \n"
            "  -p|--proxy <server:port> Setting the number of proxy servers \n"
            "  -c|--clients <n>         How many clients are created, default is 1 \n"
            "  -9|--http09              Using HTTP 0.9 protocol \n"
            "  -1|--http10              Using HTTP 1.0 protocol \n"
            "  -2|--http11              Using HTTP 1.1 protocol \n"
            "  -G|--get                 Using GET request method \n"
            "  -H|--head                Using HEAD request method \n"
            "  -O|--options             Using OPTIONS request method \n"
            "  -?|-h|--help             Display help information \n"
            "  -V|--version             Display program version information \n"  );
};

//支持的http請求方法
#define METHOD_GET 0
#define METHOD_HEAD 1
#define METHOD_OPTIONS 2
#define METHOD_TRACE 3

//默認參數設置，通常須要本身傳入命令行參數設置
int method=METHOD_GET; //默認請求方法爲get
int clients=1;         //默認只模擬一個客戶端
int force=0;           //默認須要等待服務器響應
int force_reload=0;    //失敗時從新請求
int proxyport=80;      //默認訪問服務器端口爲80
char *proxyhost=NULL;  //默認無代理服務器
int benchtime=30;      //默認模擬請求時間爲30s

//支持的http版本號
int http10=1;
/*
0表示http0.9
1表示http1.0
2表示http1.1
*/

/* 內部 */
int mypipe[2];                //管道用於父子進程通訊
char host[MAXHOSTNAMELEN];    //存儲服務器網絡地址
#define REQUEST_SIZE 2048     //最大請求次數
char request[REQUEST_SIZE];   //存放http請求報文信息數組

//判斷測試時長是否已經到達設定時間
volatile int timeout=0;
/*

 volatile:
 類型修飾符，做爲指令關鍵字，
 確保本指令不會由於編譯器優化而省略
 且每次要求從新讀值，
 編譯器在用到這個變量的時候都必須當心的從新讀取這個變量的值，
 而不是使用保存在寄存器裏的備份，保證每次讀到的都是最新的

*/

//測試結果
int speed=0;  //成功獲得服務器響應的子進程數量
int failed=0; //沒有成功獲得服務器響應的子進程數量
int bytes=0;  //全部子進程讀取到服務器回覆的總字節數

int connect_failed=0;
int send_failed=0;
int wclose_failed=0;
int read_failed=0;
int sclose_failed=0;



//程序版本號
#define PROGRAM_VERSION "1.5"

/* 函數聲明 */

//子進程真正相服務器發出請求報文並以其獲得此期間的相關數據
static void benchcore(const char* host,const int port, const char *req);

//父進程建立子進程，讀取子進程測試獲得的數據，而後統計處理
static int bench(void);

//構造http請求報文
static void build_request(const char *url);

//鬧鐘信號處理函數
static void alarm_handler(int signal)
{
    //到達設定的測壓時間，則調用鬧鐘信號處理函數
    timeout=1;//timerexpired爲1則會在循環中跳出測試
}

//構造長選項和短選項的對應
static const struct option long_options[]=
{
    {"force",no_argument,&force,1},
    {"reload",no_argument,&force_reload,1},
    {"time",required_argument,NULL,'t'},
    {"help",no_argument,NULL,'?'},
    {"http09",no_argument,NULL,'9'},
    {"http10",no_argument,NULL,'1'},
    {"http11",no_argument,NULL,'2'},
    {"get",no_argument,&method,METHOD_GET},
    {"head",no_argument,&method,METHOD_HEAD},
    {"options",no_argument,&method,METHOD_OPTIONS},
    {"version",no_argument,NULL,'V'},
    {"proxy",required_argument,NULL,'p'},
    {"clients",required_argument,NULL,'c'},
    {NULL,0,NULL,0}
};

int main(int argc, char *argv[])
{
    //argc表示參數個數
    //argv[0]表示自身運行的路徑和程序名
    //argv[1]指向第1個參數
    //argv[n]指向第n個參數

    int opt=0;
    int options_index=0;
    char *tmp=NULL;

    //進行命令行參數的處理

    //1.命令行沒有輸入參數
    if(argc==1)
    {
        usage();//顯示提示信息
        return 2;
    }

    //命令行有輸入參數則一個個解析
    //"frt:p:c:?V912"中一個字符後面加一個冒號表明該命令後面接一個參數
    //好比t,p,c命令，後面都要接一個參數
    //連續兩個冒號則表示參數無關緊要
    while((opt=getopt_long(argc,argv,"frt:p:c:?V912GHO",long_options,&options_index))!=EOF )
    {
        switch(opt)
        {
        case 'f':
            force=1;//不等待服務器響應
            printf("No waiting for server response\n");
            break;

        case 'r'://從新請求加載(無緩存)
            force_reload=1;
            printf("Re-request loading (no caching)\n");
            break;

        case '9'://使用http/0.9協議來構造請求
            http10=0;
            printf("Using HTTP/0.9\n");
            break;

        case '1':
            http10=1;//使用http/1.0協議來構造請求
            printf("Using HTTP/1.0\n");
            break;

        case '2':
            http10=2;//使用http/1.1協議來構造請求
            printf("Using HTTP/1.1\n");
            break;

        case 'V':
            printf(PROGRAM_VERSION"\n");//顯示程序版本信息
            exit(0);

        case 't'://設置運行時間，單位：秒，默認爲30秒
            benchtime=atoi(optarg);//optarg指向選項後的參數
            printf("benchtime=%d\n",benchtime);
            break;

        case 'c'://建立多少個客戶端，默認爲1個
            clients=atoi(optarg);//同上
            printf("clients=%d\n",clients);
            break;

        case 'p'://使用代理服務器，則設置其代理網絡號和端口號，格式：-p server:port

            //server:port是一個參數，下面把這個字符串解析成服務器地址和端口兩個參數

            tmp=strrchr(optarg,':');//在optagr中找到':'最後出現的位置

            proxyhost=optarg;

            if(tmp==NULL)//沒有端口號
            {
                break;
            }

            if(tmp==optarg)//端口號在optarg最開頭，說明缺失主機地址
            {
                fprintf(stderr,"Option parameter error,Proxy server %s: Missing host name ",optarg);
                return 2;
            }
            if(tmp==optarg+strlen(optarg)-1)//':'在最末尾，說明缺失端口號
            {
                fprintf(stderr,"Option parameter error,Proxy server %s: Missing port number ",optarg);
                return 2;
            }

            *tmp='\0';//將optarg從':'開始截斷，前面就是主機名，後面是端口號

            proxyport=atoi(tmp+1);//設置代理服務器端口號

            printf("Using proxy server %s:%d\n",proxyhost,proxyport);

            break;

        case 'G':
             method=METHOD_GET;
             printf("Using GET request method \n");
             break;
        case 'H':
             method=METHOD_HEAD;
             printf("Using HEAD request method \n");
             break;
        case 'O':
             method=METHOD_OPTIONS;
             printf("Using OPTIONS request method \n");
             break;
        case '?'://顯示幫助信息
            usage();
            return 2;
            break;

        default://失敗也顯示幫助信息
            usage();
            return 2;
            break;
        }
    }

    //命令參數解析完畢以後，恰好是讀到URL，此時argv[optind]指向URL
    //URL參數爲空
    if(optind==argc)
    {
        fprintf(stderr,"Missing URL\n");
        usage();
        return 2;
    }

    //設置默認值
    if(clients==0)
        clients=1;
    if(benchtime==0)
        benchtime=30;

    //程序說明
    fprintf(stderr,"WebBench: A Lightweight Web Pressure Measuring Tool "PROGRAM_VERSION" covered by YB \nGPL Open Source Software\n");

    //構造請求報文
    build_request(argv[optind]);//參數爲URL

    //請求報文構造好了，開始測壓
    printf("\nIn testing :\n");

    //選擇請求方法
    switch(method)
    {
    case METHOD_OPTIONS:
        printf("OPTIONS");
        break;

    case METHOD_HEAD:
        printf("HEAD");
        break;

    case METHOD_GET:
        printf("GET");
        break;
    default:
        printf("GET");
        break;

    }

    //打印URL
    printf(" %s",argv[optind]);

    switch(http10)
    {
    case 0:
        printf("(Using HTTP/0.9)");
        break;
    case 1:
        printf("(Using HTTP/1.0)");
        break;
    case 2:
        printf("(Using HTTP/1.1)");
        break;
    }

    printf("\n");

    printf("Operation parameters :\n");

    printf("%d Clients",clients);

    printf(",Testing running %d s",benchtime);

    if(force)
        printf(",Choose to close the connection ahead of time ");

    if(proxyhost!=NULL)
        printf(",Through proxy server %s:%d ",proxyhost,proxyport);

    if(force_reload)
        printf(",Choose no cache ");

    /*
     *換行不能少！庫函數是默認行緩衝，子進程會複製整個緩衝區
     *若不換行刷新緩衝區,子進程會把緩衝區的也打出來
     *而換行後緩衝區就刷新了
     *子進程的標準庫函數的那塊緩衝區就不會有前面這些了
    */
    printf(".\n");

    //真正開始壓力測試！
    return bench();
}

//父進程建立子進程，讀子進程測試到的數據，而後統計處理
static int bench(void)
{
    int i,j;
    int k;
    int c1,c2,c3,c4,c5;

    pid_t pid=0;//進程號定義 實際上也是int型的
    FILE *f;//文件

    //先檢查一下目標服務器是可用性
    i=Socket(proxyhost==NULL?host:proxyhost,proxyport);

    //目標服務器不可用
    if(i<0)
    {
        fprintf(stderr,"\n Connection server failed, interrupt test \n");
        return 3;
    }

    //嘗試鏈接成功了，關閉鏈接
    close(i);

    //創建父子進程通訊的管道
    if(pipe(mypipe))
    {
        perror(" Communication Pipeline Failure ");
        return 3;
    }


    /*
    父進程建立子進程後，fork函數是讓子進程徹底拷貝父進程，
    包括父進程上下文，什麼意思呢？
    就是說父進程的EIP(CPU的下一條指令地址)以及變量等等一概拷貝，
    也就是說，父進程執行過的代碼子進程是不會再執行，
    子進程下一條該執行的命令與父進程徹底同樣！！！
    */
    //建立子進程進行測試，子進程數量和clients有關
    for(i=0; i<clients; i++)
    {
        // pid 爲 pid_t 類型 表示進程號

        pid=fork();//創建子進程

        //fork失敗 子進程錯誤
        if(pid <= (pid_t) 0)
        {
            sleep(1);  //當前進程掛起1毫秒，將cpu時間交給其餘進程
            break;     //跳出去，阻止子進程繼續fork
        }
    }

    //處理fork失敗狀況
    if( pid < (pid_t) 0)
    {
        fprintf(stderr,"The %d Subprocess creation failed ",i);
        perror(" Failure to create subprocesses ");
        return 3;
    }

    //當前進程是子進程
    if(pid == (pid_t) 0)
    {

        //由子進程發出請求報文 根據是否採用代理髮送不一樣的報文
        if(proxyhost==NULL)
            benchcore(host,proxyport,request);
        else
            benchcore(proxyhost,proxyport,request);

        //子進程得到管道寫端的文件指針，準備向父進程寫結果
        f=fdopen(mypipe[1],"w");

        //管道寫端打開失敗
        if(f==NULL)
        {
            perror(" Pipeline Writer End Failed to Open ");
            return 3;
        }


        /*向管道中寫入該孩子進程在必定時間內
          請求成功的次數
          失敗次數
          讀取到服務器回覆的總字節數
        */
        fprintf(f,"%d %d %d %d %d %d %d %d\n",speed,failed,bytes,connect_failed,send_failed,wclose_failed,read_failed,sclose_failed);

        //關閉寫端
        fclose(f);

        return 0;
    }
    //當前進程是父進程
    else
    {
        //父進程得到管道讀端的文件指針
        f=fdopen(mypipe[0],"r");

        //管道讀端打開失敗
        if(f==NULL)
        {
            perror(" Pipeline Reader Failed to Open ");
            return 3;
        }

        /*
        fopen標準IO函數是自帶緩衝區的
        咱們輸入的數據很是短，而且數據要及時
        因此沒有緩衝是最合適的
        咱們不須要緩衝區
        所以把緩衝類型設置爲_IONBF*/
        setvbuf(f,NULL,_IONBF,0);

        speed=0;  //鏈接成功次數，後面除以時間能夠獲得速度
        failed=0; //失敗的請求次數
        bytes=0;  //服務器回覆的總字節數

        connect_failed=0;
        send_failed=0;
        wclose_failed=0;
        read_failed=0;
        sclose_failed=0;


        //父進程不停的讀
        while(1)
        {
            //讀入參數以及獲得成功獲得的參數的個數
            pid=fscanf(f,"%d %d %d %d %d %d %d %d",&i,&j,&k,&c1,&c2,&c3,&c4,&c5);

            //成功獲得的參數個數小於8
            if(pid<8)
            {
                fprintf(stderr,"A child process deaid\n");
                break;
            }

            //計總數
            speed+=i;
            failed+=j;
            bytes+=k;

            connect_failed+=c1;
            send_failed+=c2;
            wclose_failed+=c3;
            read_failed+=c4;
            sclose_failed+=c5;



            if(--clients==0)//記錄已經讀了多少個子進程的數據，讀完就退出
                break;
        }

        //關閉讀端
        fclose(f);

        //統計處理結果
        printf("\nSpeed:%d pages/min,%lld bytes/s.\nRequest:%d Success,%d Fail\n",\
              (int)((speed+failed)/(benchtime/60.0f)),\
              (int)(bytes/(float)benchtime),\
              speed,failed);

        //失敗的類型及個數
        printf("Reasons for failure:\n");
        printf("connect failed:%d\n",connect_failed);
        printf("send message failed:%d\n",send_failed);
        printf("write-side shutdown failed:%d\n",wclose_failed);
        printf("read server message failed:%d\n",read_failed);
        printf("socket close failed:%d\n",sclose_failed);

    }

    return i;
}

//子進程真正向服務器發送請求報文並以其獲得期間相關數據
void benchcore(const char *host,const int port,const char *req)
{
    int rlen;
    char buf[1500];//記錄服務器響應請求返回的數據
    int s,i;
    struct sigaction sa;//信號處理函數定義

    //設置alarm_handler函數爲鬧鐘信號處理函數
    sa.sa_handler=alarm_handler;
    sa.sa_flags=0;

    if(sigaction(SIGALRM,&sa,NULL))//超時會產生信號SIGALRM，用sa中指定函數處理
        exit(3);

    alarm(benchtime);//開始計時

    rlen=strlen(req);//獲得請求報文的長度

nexttry:
    while(1)
    {
        //只有在收到鬧鐘信號後會使得timeout=1
        if(timeout)//超時返回
        {
            //修正失敗信號
            if(failed>0)
                failed--;
            if(connect_failed>0)
                connect_failed--;
            else if(send_failed>0)
                send_failed--;
            else if(wclose_failed>0)
                wclose_failed--;
            else if(read_failed>0)
                read_failed--;
            else if(sclose_failed>0)
                sclose_failed--;

            return;
        }

        //創建到目的網站的tcp鏈接,發送http請求
        s=Socket(host,port);

        //鏈接失敗
        if(s<0)
        {
            failed++;//失敗次數+1
            connect_failed++;
            continue;
        }

        //發出請求報文
        if(rlen!=write(s,req,rlen))//write函數會返回實際寫入的字節數
        {
            failed++;//實際寫入的字節數和請求報文字節數不相同，寫失敗，發送1失敗次數+1
            send_failed++;
            close(s);//寫失敗了也不要忘記關閉套接字
            continue;
        }

        //http/0.9的特殊處理
        /*
         *由於http/0.9是在服務器回覆後自動斷開鏈接
         *在此能夠提早先完全關閉套接字的寫的一半，若是失敗了那確定是個不正常的狀態
         *事實上，關閉寫後，服務器沒有寫完數據也不會再寫了，這個就不考慮了
         *若是關閉成功則繼續日後，由於可能還須要接收服務器回覆的內容
         *當這個寫必定是能夠關閉的，由於客戶端也不須要寫，只須要讀
         *所以，咱們主動破壞套接字的寫，但這不是關閉套接字，關閉仍是得用close
        */
        if(http10==0)
        {
            if(shutdown(s,1))//1表示關閉寫 關閉成功返回0，出錯返回-1
            {
                failed++;//關閉出錯，失敗次數+1
                wclose_failed++;
                close(s);//關閉套接字
                continue;
            }
        }

        //foece=0 默認須要等待服務器回覆
        if(force==0)
        {
            //從套接字讀取全部服務器回覆的數據
            while(1)
            {
                //超時標誌爲1，再也不讀取服務器回覆的數據
                if(timeout)
                    break;

                //讀取套接字中1500個字節數據到buf數組中
                i=read(s,buf,1500);//若是套接字中數據小於要讀取的字節數1500會引發阻塞 返回-1

                //read返回值：

                //未讀取任何數據   返回   0
                //讀取成功         返回   已經讀取的字節數
                //阻塞             返回   -1


                //讀取阻塞了
                if(i<0)
                {
                    failed++;       //失敗次數+1
                    read_failed++;
                    close(s);       //關閉套接字，否則失敗次數多會嚴重浪費資源
                    goto nexttry;   //此次失敗了那麼繼續請求下一次鏈接和發出請求
                }
                //讀取成功
                else
                {
                    if(i==0)
                        break;//沒有讀取到任何字節數
                    else
                        bytes+=i;//從服務器讀取到的總字節數增長
                }
            }
        }

        /*

        close返回返回值
        成功   返回 0
        失敗   返回 -1

        */

        //套接字關閉失敗
        if(close(s))
        {
            failed++;//沒有成功獲得服務器響應的子進程數量
            sclose_failed++;
            continue;
        }

        //套接字關閉成功 成功獲得服務器響應的子進程數量+1
        speed++;
    }
}

//構造http報文請求到request數組
/*

典型的http/1.1的get請求以下：

從下一行開始
GET /test.jpg HTTP/1.1  //請求行：請求方法+url+協議版本
User-Agent: WebBench 1.5
Host:192.168.10.1
Pragma: no-cache
Connection: close

//從上行結束，最後必需要有一個空行

該函數目的就是根據需求填充出這樣一個http請求放到request報文請求數組中
*/
void build_request(const char *url)
{
    //存放端口號的中間數組
    char tmp[10];
    //存放url中主機名開始的位置
    int i;

    //初始化
    memset(host,0,MAXHOSTNAMELEN);
    memset(request,0,REQUEST_SIZE);


    //判斷應該使用的http協議

    //1.緩存和代理都是都是http/1.0之後纔有到的
    if(force_reload && proxyhost!=NULL && http10<1)
        http10=1;

    //2.head請求是http/1.0後纔有的
    if(method==METHOD_HEAD && http10<1)
        http10=1;

    //3.options請求和reace請求都是http/1.1纔有
    if(method==METHOD_OPTIONS && http10<2)
        http10=2;
    if(method==METHOD_TRACE && http10<2)
        http10=2;

    //開始填寫http請求


    //填充請求方法到請求行
    switch(method)
    {
    default:
    case METHOD_GET:
        strcpy(request,"GET");
        break;
    case METHOD_HEAD:
        strcpy(request,"HEAD");
        break;
    case METHOD_OPTIONS:
        strcpy(request,"OPTIONS");
        break;
    case METHOD_TRACE:
        strcpy(request,"TRACE");
        break;
    }

    //按照請求報文格式在請求方法後填充一個空格
    strcat(request," ");

    //判斷url的合法性

    //1.url中沒有 "://" 字符
    if(NULL==strstr(url,"://"))
    {
        fprintf(stderr,"\n %s:is an illegal URL\n",url);
        exit(2);//結束當前進程 2表示是由於url不合法致使進程中止的
    }
    //2.url過長
    if(strlen(url)>1500)
    {
        fprintf(stderr,"URL too long\n");
        exit(2);
    }

    //3.若無代理服務器，則只支持http協議
    if(proxyhost==NULL)
    {
        //忽略字母大小寫比較前7位
        if (0!=strncasecmp("http://",url,7))
        {
            fprintf(stderr,"\n URL can't be parsed, need it or not, but don't choose to use proxy server\n");
            usage();
            exit(2);
        }
    }

    //在url中找到主機名開始的地方
    //好比：http://baidu.com:80/
    //主機名開始的地方爲bai....
    //i==7
    i=strstr(url,"://")-url+3;

    //4.從主機名開始的地方開始日後找，沒有 '/' 則url非法
    if(strchr(url+i,'/')==NULL)
    {
        fprintf(stderr,"\n URL illegal: hostname does not end with'/' \n");
        exit(2);
    }
    //url合法性判斷到此結束

    //開始填寫url到請求行

    //無代理時
    if(proxyhost==NULL)
    {
        //存在端口號 好比http://www.baidu.com:80/
        if(index(url+i,':')!=NULL && index(url+i,':')<index(url+i,'/'))
        {
            //填充主機名到host字符數組，好比www.baidu.com
            strncpy(host,url+i,strchr(url+i,':')-url-i);

            //初始化存放端口號的中間數組
            memset(tmp,0,10);

            //切割獲得端口號
            strncpy(tmp,index(url+i,':')+1,strchr(url+i,'/')-index(url+i,':')-1);
            /* printf("tmp=%s\n",tmp); */

            //設置端口號 atoi將字符串轉整型
            proxyport=atoi(tmp);

            //避免寫了';'卻沒有寫端口號，這種狀況下默認設置端口號爲80
            if(proxyport==0)
                proxyport=80;
        }
        //不存在端口號
        else
        {
            //填充主機名到host字符數組，好比www.baidu.com
            strncpy(host,url+i,strcspn(url+i,"/"));
        }
        // printf("Host=%s\n",host);

        //將主機名，以及可能存在的端口號以及請求路徑填充到請求報文中
        //好比url爲http://www.baidu.com:80/one.jpg/
        //就是將www.baidu.com:80/one.jpg填充到請求報文中
        strcat(request+strlen(request),url+i+strcspn(url+i,"/"));
    }
    //存在代理服務器時就比較簡單了，直接填寫，不用本身處理
    else
    {
        // printf("ProxyHost=%s\nProxyPort=%d\n",proxyhost,proxyport);

        //直接將url填充到請求報文
        strcat(request,url);
    }

    //填充http協議版本到請求報文的請求行
    if(http10==1)
        strcat(request," HTTP/1.0");
    else if (http10==2)
        strcat(request," HTTP/1.1");

    //請求行填充結束，換行
    strcat(request,"\r\n");


    //填寫請求報文的報頭
    if(http10>0)
        strcat(request,"User-Agent: WebBench "PROGRAM_VERSION"\r\n");

    //不存在代理服務器且http協議版本爲1.0或1.1，填充Host字段
    //當存在代理服務器或者http協議版本爲0.9時，不須要填充Host字段
    //由於http0.9版本沒有Host字段，而代理服務器不須要Host字段
    if(proxyhost==NULL && http10>0)
    {
        strcat(request,"Host: ");
        strcat(request,host);//Host字段填充的是主機名或者IP
        strcat(request,"\r\n");
    }

    /*pragma是http/1.1以前版本的歷史遺留問題，僅做爲與http的向後兼容而定義
    規範定義的惟一形式：
    Pragma:no-cache
    若選擇強制從新加載，則選擇無緩存
    */
    if(force_reload && proxyhost!=NULL)
    {
        strcat(request,"Pragma: no-cache\r\n");
    }

    /*咱們的目的是構造請求給網站，不須要傳輸任何內容，因此沒必要用長鏈接
    http/1.1默認Keep-alive(長鏈接）
    因此須要當http版本爲http/1.1時要手動設置爲 Connection: close
    */
    if(http10>1)
        strcat(request,"Connection: close\r\n");

    //在末尾填入空行
    if(http10>0)
        strcat(request,"\r\n");

    //fprintf("\nRequest:\n%s\n",request);
}

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。