C語言 -- 字符串詳解

  字符串是一種很是重要的數據類型,可是C語言不存在顯式的字符串類型,C語言中的字符串都以字符串常量的形式出現或存儲在字符數組中。同時,C 語言提供了一系列庫函數來對操做字符串,這些庫函數都包含在頭文件 string.h 中。數組

1、字符串常量和字符數組安全

1.一、什麼是字符串常量函數

  C 語言雖然沒有字符串類型,可是 C語言提是存在字符串這個概念的,也就是字符串常量:以 NUL 字節結尾的 0 個或多個字符組成的序列字符串常量是不可被修改的,通常用一對雙引號(" ")括起的一串字符來表示字符串常量,如:spa

  "Hello!"、"\aWarning!\a"、"123abc\n"、""設計

  字符串常量能夠爲空,如""就是一個空的字符串常量,可是即便爲空,仍是存在一個終止符 NUL 的。(在 C 語言中,經常使用轉義字符 \0 來表示 NUL)指針

 

1.二、字符串常量與指針code

  字符串常量與指針關係密切,由於字符串常量的值,實際上表示的是存儲這些字符的內存空間的地址,更準確地說是字符串常量中第 1 個字符的地址,而不是這些字符自己。所以,在 C 語言中是不能直接進行字符串賦值的(由於沒有字符串類型嘛)。在 C 語言中,常經過聲明一個指向 char 類型的指針並將其初始化爲一個字符串常量的方式來訪問一個字符串:blog

char *message = "Hello World!";

// 上面的語句也能夠拆分紅下面兩句
char *message;
message = "Hello World!";    // 這句話看起來像是字符串複製,其實不是,只是涉及到指針操做

  上述語句聲明瞭一個指向 char 類型的指針,並用字符串常量中第 1 個字符的地址對該指針進行初始化。能夠經過字符指針 message 來訪問字符串常量:內存

#include <stdio.h>

int main()
{
  char *message = "Hello World!";
  printf("%s\n",message);
  while(*message != '\0'){
    printf("%c ",*message++);
  }
  printf("\n");
  return 0;
}

/* output:
 * Hello World!
 * H e l l o   W o r l d !
 */

   這段代碼,使用字符指針遍歷了字符串常量中的每個字符。字符串

 

1.三、字符數組

  用於存放字符的數組稱爲字符數組。在 C 語言中,除了字符串常量外,其餘全部字符串都必須存儲於字符數組或動態分配的內存中。定義一個字符數組和定義一個普通數組同樣,不一樣的是字符數組中存放的是字符數據而已:

char charArray[] = {'H','e','l','l','o'};    // 聲明並初始化一個字符數組

   這句話定義並初始化了一個字符數組 charArray。這個數組的長度實際上爲 6 ,由於會自動添加一個字符串結束符 '\0'。

   C 語言提供了一種更簡潔的方法來對字符數組進行初始化:

char charArray[] = "Hello World!";    // 聲明並初始化一個字符數組

  上述兩種聲明方式等價。 

  能夠對一個字符數組作出修改:

#include <stdio.h>
#include <string.h>

int main()
{
        char str[] = "hello world!";
        int len = strlen(str);
        int i;
        for(i = 0; i < len; i++){
                if( str[i] <= 'z' && str[i] >= 'a'){
                        str[i] = str[i] - 32;
                }
        }
        printf("%s\n",str);
}

   這段代碼能夠將字符數組中的小寫字母轉換成大寫字母后輸出。

 

1.四、 字符串常量與字符數組的區別

1)字符串常量是一個字符數組,可是內容和長度在初始化時就已經固定了,不可更改;能夠經過一個指向字符串常量第一個元素的指針來訪問該字符串常量;

2)字符數組是一個用於存放字符的數組,字符數組的值是能夠更改的。

 

2、獲取字符串長度

  字符串的長度就是這個字符串所包含字符的個數,可是這個長度是不包含 NUL 字符的。C 語言中使用庫函數 strlen 來計算字符串長度:

size_t strlen(char const *string);

   須要注意的是 strlen 的返回值類型:size_t 類型,這是一個無符號整數類型。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main() 
{
    char str1[] = "Hello World!";
    printf("%d\n",strlen(str1));

    return 0;
}

/* output:
 * 12
 */

 

3、複製字符串

  C 語言中使用庫函數 strcpy 來進行字符串複製操做:

char *strcpy(char *dst , char const *src);

  函數 strcpy 接收兩個字符串參數,並將參數 src 字符串複製到 dst 參數。使用 strcpy 函數時須要注意的是,必須保證目標字符數組 dst 的長度足夠存放源字符數組 src 的內容。若是 src 比 dst 長,則 src 剩餘部分的字符仍會被複制,並且它們會覆蓋 dst 後面的內存空間的值,若是這除內存空間本來就存放有值,則會致使本來的數據丟失,這樣會形成很嚴重的後果。爲了解決這個問題, C 語言中提供了一種更爲安全的方式來進行字符串複製操做——strncpy 函數:

char *strncpy(char *dst , char const *src , size_t len);

   strncpy 函數有三個參數,與 strcpy 函數同樣,它也是將 src 字符串中的字符複製到目標數組 dst 中去,可是 strncpy 函數提供的第三個參數 len 規定了能夠向 dst 中寫入的字符的個數:

1)若是 strlen(src) > len,則只有 len 個字符被複制到 dst 中去,此時 dst 將不會以 NUL 字節結尾(也就是說,strncpy 調用的結果可能不是一個字符串);

2)若是 strlen(src) < len,則 src 中的字符全被複制到 dst 中去,dst 中剩餘的部分用 NUL 填充。

 

 4、鏈接字符串

  C 語言中使用庫函數 strcat 來鏈接兩個字符串:

char *strcat(char *dst,char const *src);

  函數 strcat 將參數 src 字符串鏈接到參數 dst 字符串的後面。與 strcpy 函數一個一樣的問題是,必須保證 dst 的剩餘空間足夠存放下 src 整個字符串。C 語言中提供了 strncat 函數來解決這個問題: 

char *strncat(char *dst , char const *src , size_t len);

   strncat 函數從 src 中最多複製 len 個字符到目標數組 dst 後面,而且,strncat 老是在結果字符串後面添加一個 NUL 字節,並且不會像 strncpy 函數那樣對 dst 剩餘的空間用 NUL 進行填充。

 

5、字符串比較

  C 語言中使用庫函數 strcmp 來進行字符串比較。strcmp 函數會對被比較的兩個字符串進行逐字符地比較,直到發現不匹配爲止:最早不匹配的字符中較小的那個字符所對應的字符串即被認爲小於另外一個字符串;若是二者全部字符都匹配,則認爲這兩個字符串相等;

int strcmp(char const *s1 , char sonst *s2);

該函數的返回值以下:

1)s1 小於 s2,返回一個負值;

2)s1 等於 s2,返回 0;

3)s1 大於 s2,返回一個正值。

char *strncmp(char const *s1 , char const *s2 , size_t len);

  可使用 strncmp 函數限定比較的字符的個數,返回值與 strcmp 同樣,可是隻針對前 len 個字符進行比較。

 

6、字符串的查找

6.1 查找一個字符

  可使用 strchr 函數或 strrchr 函數來在一個字符串中查找一個特定的字符:

char *strchr(char const *str,int ch);    // int ch 是字符的ASCII碼值
char *strrchr(char const *str,int ch);

  函數 strchr 在字符串 str 中查找字符 ch 第一次出現的位置,並返回一個指向該位置的指針;若是沒有找到相應的字符,則返回一個 NULL 指針。函數 strrchr 在字符串中查找字符 ch 最後一次出現的位置,並返回指向該位置的指針。

 

6.2 查找任意幾個字符

  可使用 strpbrk 函數來查找任何一組字符第一次在字符串中出現的位置:

char *strpbrk(char const *str , char const *group);

  這個函數返回一個指向字符串 str 中第一個匹配 group 中任何一個字符的字符位置,若是沒有匹配到,則返回一個 NULL 指針。 

 

6.3 查找一個子串

  可使用 strstr 函數來在一個字符串中查找一個子串:

char *strstr(char const *str1 , char const *str2);

  這個函數在 str1 中查找整個字符串 str2 第一次出現的起始位置,並返回一個指向該位置的指針;若是 str2 並無完整的出如今 str1 中,則函數將返回一個 NULL 指針;若是 str2 是一個空字符串,則返回str1.

 

參考資料

《C和指針》

《C程序設計語言 第二版》

相關文章
相關標籤/搜索