C++ string 詳解php
任何人對本文進行引用都要標明做者是Nicolai M.Josuttisios
///////////////////////////////////////////////////////////////////////////////////正則表達式
C++ 語言是個十分優秀的語言,但優秀並不表示完美。仍是有許多人不肯意使用C或者C++,爲何?緣由衆多,其中之一就是C/C++的文本處理功能太麻煩,用 起來很不方便。之前沒有接觸過其餘語言時,每當別人這麼說,我老是不屑一顧,認爲他們根本就沒有領會C++的精華,或者不太懂C++,如今我接觸 perl, php, 和Shell腳本之後,開始理解了之前爲何有人說C++文本處理不方便了。算法
舉例來講,若是文本格式是:用戶名 電話號碼,文件名name.txt Tom 23245332 Jenny 22231231 Heny 22183942 Tom 23245332 ...shell
如今咱們須要對用戶名排序,且只輸出不一樣的姓名。數據庫
那麼在shell 編程中,能夠這樣用:apache
awk '{print $1}' name.txt | sort | uniq
簡單吧?編程
若是使用C/C++ 就麻煩了,他須要作如下工做: 先打開文件,檢測文件是否打開,若是失敗,則退出。 聲明一個足夠大得二維字符數組或者一個字符指針數組 讀入一行到字符空間 而後分析一行的結構,找到空格,存入字符數組中。 關閉文件 寫一個排序函數,或者使用寫一個比較函數,使用sort()排序 遍歷數組,比較是否有相同的,若是有,則要刪除,copy... 輸出信息數組
你能夠用C++或者C語言去實現這個流程。若是一我的的主要工做就是處理這種相似的文本(例如作apache的日誌統計和分析),你說他會喜歡C/C++麼?安全
固然,有了STL,這些處理會獲得很大的簡化。咱們可使用 fstream來代替麻煩的fopen fread fclose, 用vector來代替數組。最重要的是用 string來代替char * 數組,使用sort排序算法來排序,用unique 函數來去重。聽起來好像很不錯。看看下面代碼(例程1):
#include <string> #include <iostream> #include <algorithm> #include <vector> #include <fstream> using namespace std; int main() { ifstream in("name.txt"); string strtmp; vector<string> vect; while(getline(in, strtmp, '\n')) vect.push_back(strtmp.substr(0, strtmp.find(' '))); sort(vect.begin(), vect.end()); vector<string>::iterator it=unique(vect.begin(), vect.end()); copy(vect.begin(), it, ostream_iterator<string>(cout, "\n")); return 0; }
也還不錯吧,至少會比想象得要簡單得多!(代碼裏面沒有對錯誤進行處理,只是爲了說明問題,不要效仿).
固然,在這個文本格式中,不用vector而使用map會更有擴充性,例如,還可經過人名找電話號碼等等,可是使用了map就不那麼好用sort了。你能夠用map試一試。
這裏string的做用不僅是能夠存儲字符串,還能夠提供字符串的比較,查找等。在sort和unique函數中就默認使用了less 和equal_to函數, 上面的一段代碼,其實使用了string的如下功能: 存儲功能,在getline() 函數中 查找功能,在find() 函數中 子串功能,在substr() 函數中 string operator < , 默認在sort() 函數中調用 string operator == , 默認在unique() 函數中調用
總之,有了string 後,C++的字符文本處理功能總算獲得了必定補充,加上配合STL其餘容器使用,其在文本處理上的功能已經與perl, shell, php的距離縮小不少了。 所以掌握string 會讓你的工做事半功倍。
1 string 使用
其實,string並非一個單獨的容器,只是basic_string 模板類的一個typedef 而已,相對應的還有wstring, 你在string 頭文件中你會發現下面的代碼:
extern "C++" { typedef basic_string <char> string; typedef basic_string <wchar_t> wstring; } // extern "C++"
因爲只是解釋string的用法,若是沒有特殊的說明,本文並不區分string 和 basic_string的區別。
string 其實至關於一個保存字符的序列容器,所以除了有字符串的一些經常使用操做之外,還有包含了全部的序列容器的操做。字符串的經常使用操做包括:增長、刪除、修改、查 找比較、連接、輸入、輸出等。詳細函數列表參看附錄。不要懼怕這麼多函數,其實有許可能是序列容器帶有的,平時不必定用的上。
若是你要想了解全部函數的詳細用法,你須要查看basic_string,或者下載STL編程手冊。這裏經過實例介紹一些經常使用函數。
1.1 充分使用string 操做符
string 重載了許多操做符,包括 +, +=, <, =, , [], <<, >>等,正式這些操做符,對字符串操做很是方便。先看看下面這個例子:
#include <string> #include <iostream> using namespace std; int main() { string strinfo="Please input your name:"; cout << strinfo ; cin >> strinfo; if( strinfo == "winter" ) cout << "you are winter!"<<endl; else if( strinfo != "wende" ) cout << "you are not wende!"<<endl; else if( strinfo < "winter") cout << "your name should be ahead of winter"<<endl; else cout << "your name should be after of winter"<<endl; strinfo += " , Welcome to China!"; cout << strinfo<<endl; cout <<"Your name is :"<<endl; string strtmp = "How are you? " + strinfo; for(int i = 0 ; i < strtmp.size(); i ++) cout<<strtmp[i]; return 0; }
下面是程序的輸出
Please input your name:Hero you are not wende! Hero , Welcome to China! How are you? Hero , Welcome to China!
有了這些操做符,在STL中仿函數均可以直接使用string做爲參數,例如 less, great, equal_to 等,所以在把string做爲參數傳遞的時候,它的使用和int 或者float等已經沒有什麼區別了。例如,你可使用:
map<string, int> mymap; //以上默認使用了 less<string>
有了 operator + 之後,你能夠直接連加,例如:
string strinfo="Winter"; string strlast="Hello " + strinfo + "!"; string strtest="Hello " + strinfo + " Welcome" + " to China" + " !";//你還能夠這樣:
看見其中的特色了嗎?只要你的等式裏面有一個 string 對象,你就能夠一直連續"+",但有一點須要保證的是,在開始的兩項中,必須有一項是 string 對象。其原理很簡單:
系統遇到"+"號,發現有一項是string 對象。 系統把另外一項轉化爲一個臨時 string 對象。 執行 operator + 操做,返回新的臨時string 對象。 若是又發現"+"號,繼續第一步操做。
因爲這個等式是由左到右開始檢測執行,若是開始兩項都是const char ,程序本身並無定義兩個const char 的加法,編譯的時候確定就有問題了。
有了操做符之後,assign(), append(), compare(), at()等函數,除非有一些特殊的需求時,通常是用不上。固然at()函數還有一個功能,那就是檢查下標是否合法,若是是使用:
string str="winter";//下面一行有可能會引發程序中斷錯誤 str[100]='!';//下面會拋出異常:throws: out_of_range cout<<str.at(100)<<endl;
瞭解了嗎?若是你但願效率高,仍是使用[]來訪問,若是你但願穩定性好,最好使用at()來訪問。
1.2 眼花繚亂的string find 函數
因爲查找是使用最爲頻繁的功能之一,string 提供了很是豐富的查找函數。其列表以下: 函數名 描述 find 查找 rfind 反向查找 find_first_of 查找包含子串中的任何字符,返回第一個位置 find_first_not_of 查找不包含子串中的任何字符,返回第一個位置 find_last_of 查找包含子串中的任何字符,返回最後一個位置 find_last_not_of 查找不包含子串中的任何字符,返回最後一個位置以上函數都是被重載了4次,如下是以find_first_of 函數爲例說明他們的參數,其餘函數和其參數同樣,也就是說總共有24個函數 :
size_type find_first_of(const basic_string& s, size_type pos = 0) size_type find_first_of(const charT* s, size_type pos, size_type n) size_type find_first_of(const charT* s, size_type pos = 0) size_type find_first_of(charT c, size_type pos = 0)
全部的查找函數都返回一個size_type類型,這個返回值通常都是所找到字符串的位置,若是沒有找到,則返回string::npos。有一點 須要特別注意,全部和string::npos的比較必定要用string::size_type來使用,不要直接使用int 或者unsigned int等類型。其實string::npos表示的是-1, 看看頭文件:
template <class _CharT, class _Traits, class _Alloc> const basic_string<_CharT,_Traits,_Alloc>::size_type basic_string<_CharT,_Traits,_Alloc>::npos = basic_string<_CharT,_Traits,_Alloc>::size_type) -1;
find 和 rfind 都還比較容易理解,一個是正向匹配,一個是逆向匹配,後面的參數pos都是用來指定起始查找位置。對於find_first_of 和find_last_of 就不是那麼好理解。
find_first_of 是給定一個要查找的字符集,找到這個字符集中任何一個字符所在字符串中第一個位置。或許看一個例子更容易明白。
有這樣一個需求:過濾一行開頭和結尾的全部非英文字符。看看用string 如何實現:
#include <string> #include <iostream> using namespace std; int main() { string strinfo=" //*---Hello Word!......------"; string strset="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"; int first = strinfo.find_first_of(strset); if(first == string::npos) { cout<<"not find any characters"<<endl; return -1; } int last = strinfo.find_last_of(strset); if(last == string::npos) { cout<<"not find any characters"<<endl; return -1; } cout << strinfo.substr(first, last - first + 1)<<endl; return 0; }
這裏把全部的英文字母大小寫做爲了須要查找的字符集,先查找第一個英文字母的位置,而後查找最後一個英文字母的位置,而後用substr 來的到中間的一部分,用於輸出結果。下面就是其結果:
Hello Word
前面的符號和後面的符號都沒有了。像這種用法能夠用來查找分隔符,從而把一個連續的字符串分割成爲幾部分,達到 shell 命令中的 awk 的用法。特別是當分隔符有多個的時候,能夠一次指定。例若有這樣的需求:
張三|3456123, 湖南 李四,4564234| 湖北 王小二, 4433253|北京 ...
咱們須要以 "|" ","爲分隔符,同時又要過濾空格,把每行分紅相應的字段。能夠做爲你的一個做業來試試,要求代碼簡潔。
1.3 string insert, replace, erase
瞭解了string 的操做符,查找函數和substr,其實就已經瞭解了string的80%的操做了。insert函數, replace函數和erase函數在使用起來相對簡單。下面以一個例子來講明其應用。 string只是提供了按照位置和區間的replace函數,而不能用一個string字串來替換指定string中的另外一個字串。這裏寫一個函數來實現這個功能:
void string_replace(string & strBig, const string & strsrc, const string &strdst) { string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); while( (pos=strBig.find(strsrc, pos)) != string::npos) { strBig.replace(pos, srclen, strdst); pos += dstlen; } }
看看如何調用:
#include <string> #include <iostream> using namespace std; int main() { string strinfo="This is Winter, Winter is a programmer. Do you know Winter?"; cout<<"Orign string is :\n"<<strinfo<<endl; string_replace(strinfo, "Winter", "wende"); cout<<"After replace Winter with wende, the string is :\n"<<strinfo<<endl; return 0; }
其輸出結果:
Orign string is : This is Winter, Winter is a programmer. Do you know Winter? After replace Winter with wende, the string is : This is wende, wende is a programmer. Do you know wende?
若是不用replace函數,則可使用erase和insert來替換,也能實現string_replace函數的功能:
void string_replace(string & strBig, const string & strsrc, const string &strdst) { string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); while( (pos=strBig.find(strsrc, pos)) != string::npos) { strBig.erase(pos, srclen); strBig.insert(pos, strdst); pos += dstlen; } }
固然,這種方法沒有使用replace來得直接。
2 string 和C-style字符串
如今看了這麼多例子,發現const char* 能夠和string 直接轉換,例如咱們在上面的例子中,使用
string_replace(strinfo, "Winter", "wende");來代用void string_replace(string & strBig, const string & strsrc, const string &strdst)
在C語言中只有char 和 const char,爲了使用起來方便,string提供了三個函數知足其要求:
const charT* c_str() const const charT* data() const size_type copy(charT* buf, size_type n, size_type pos = 0) const
其中: c_str 直接返回一個以\0結尾的字符串。 data 直接以數組方式返回string的內容,其大小爲size()的返回值,結尾並無\0字符。 copy 把string的內容拷貝到buf空間中。 你或許會問,c_str()的功能包含data(),那還須要data()函數幹什麼?看看源碼:
const charT* c_str () const { if (length () == 0) return ""; terminate (); return data (); }
原來c_str()的流程是:先調用terminate(),而後在返回data()。所以若是你對效率要求比較高,並且你的處理又不必定須要 以\0的方式結束,你最好選擇data()。可是對於通常的C函數中,須要以const char*爲輸入參數,你就要使用c_str()函數。
對於c_str() data()函數,返回的數組都是由string自己擁有,千萬不可修改其內容。其緣由是許多string實現的時候採用了引用機制,也就是說,有可能幾 個string使用同一個字符存儲空間。並且你不能使用sizeof(string)來查看其大小。詳細的解釋和實現查看Effective STL的條款15:當心string實現的多樣性。
另外在你的程序中,只在須要時才使用c_str()或者data()獲得字符串,每調用一次,下次再使用就會失效,如:
string strinfo("this is Winter"); ... //最好的方式是: foo(strinfo.c_str()); //也能夠這麼用: const char* pstr=strinfo.c_str(); foo(pstr); //不要再使用了pstr了, 下面的操做已經使pstr無效了。 strinfo += " Hello!"; foo(pstr);//錯誤!
會遇到什麼錯誤?當你幸運的時候pstr可能只是指向"this is Winter Hello!"的字符串,若是不幸運,就會致使程序出現其餘問題,總會有一些不可碰見的錯誤。總之不會是你預期的那個結果。
3 string 和 Charactor Traits 瞭解了string的用法,該詳細看看string的真相了。前面提到string 只是basic_string的一個typedef。看看basic_string 的參數:
template <class charT, class traits = char_traits<charT>, class Allocator = allocator<charT> > class basic_string { //... }
char_traits不只是在basic_string 中有用,在basic_istream 和 basic_ostream中也須要用到。 就像Steve Donovan在過分使用C++模板中提到的,這些確實有些過頭了,要不是系統本身定義了相關的一些屬性,並且用了個typedef,不然還真不知道如何使用。
但複雜總有複雜道理。有了char_traits,你能夠定義本身的字符串類型。固然,有了char_traits < char > 和char_traits < wchar_t > 你的需求使用已經足夠了,爲了更好的理解string ,我們來看看char_traits都有哪些要求。
若是你但願使用你本身定義的字符,你必須定義包含下列成員的結構: 表達式 描述
char_type 字符類型
int_type int 類型
pos_type 位置類型
off_type 表示位置之間距離的類型
state_type 表示狀態的類型
assign(c1,c2) 把字符c2賦值給c1
eq(c1,c2) 判斷c1,c2 是否相等
lt(c1,c2) 判斷c1是否小於c2
length(str) 判斷str的長度
compare(s1,s2,n) 比較s1和s2的前n個字符
copy(s1,s2, n) 把s2的前n個字符拷貝到s1中
move(s1,s2, n) 把s2中的前n個字符移動到s1中
assign(s,n,c) 把s中的前n個字符賦值爲c
find(s,n,c) 在s的前n個字符內查找c
eof() 返回end-of-file
to_int_type(c) 將c轉換成int_type
to_char_type(i) 將i轉換成char_type
not_eof(i) 判斷i是否爲EOF
eq_int_type(i1,i2) 判斷i1和i2是否相等
想看看實際的例子,你能夠看看sgi STL的char_traits結構源碼.
如今默認的string版本中,並不支持忽略大小寫的比較函數和查找函數,若是你想練練手,你能夠試試改寫一個char_traits , 而後生成一個case_string類, 也能夠在string 上作繼承,而後派生一個新的類,例如:ext_string,提供一些經常使用的功能,例如:
定義分隔符。給定分隔符,把string分爲幾個字段。 提供替換功能。例如,用winter, 替換字符串中的wende 大小寫處理。例如,忽略大小寫比較,轉換等 整形轉換。例如把"123"字符串轉換爲123數字。 這些都是經常使用的功能,若是你有興趣能夠試試。其實有人已經實現了,看看Extended STL string。若是你想偷懶,下載一個頭文件就能夠用,有了它確實方便了不少。要是有人能提供一個支持正則表達式的string,我會很是樂意用。
4 string 建議 使用string 的方便性就不用再說了,這裏要重點強調的是string的安全性。 string並非萬能的,若是你在一個大工程中須要頻繁處理字符串,並且有多是多線程,那麼你必定要慎重(固然,在多線程下你使用任何STL容器都要慎重)。 string的實現和效率並不必定是你想象的那樣,若是你對大量的字符串操做,並且特別關心其效率,那麼你有兩個選擇,首先,你能夠看看你使用的STL版本中string實現的源碼;另外一選擇是你本身寫一個只提供你須要的功能的類。 string的c_str()函數是用來獲得C語言風格的字符串,其返回的指針不能修改其空間。並且在下一次使用時從新調用得到新的指針。 string的data()函數返回的字符串指針不會以'\0'結束,千萬不可忽視。 儘可能去使用操做符,這樣可讓程序更加易懂
5 小結 難怪有人說:string 使用方便功能強,咱們一直用它!
6 附錄
string 函數列表 函數名 描述 begin 獲得指向字符串開頭的Iterator end 獲得指向字符串結尾的Iterator rbegin 獲得指向反向字符串開頭的Iterator rend 獲得指向反向字符串結尾的Iterator size 獲得字符串的大小 length 和size函數功能相同 max_size 字符串可能的最大大小 capacity 在不從新分配內存的狀況下,字符串可能的大小 empty 判斷是否爲空 operator[] 取第幾個元素,至關於數組 c_str 取得C風格的const char* 字符串 data 取得字符串內容地址 operator= 賦值操做符 reserve 預留空間 swap 交換函數 insert 插入字符 append 追加字符 push_back 追加字符 operator+= += 操做符 erase 刪除字符串 clear 清空字符容器中全部內容 resize 從新分配空間 assign 和賦值操做符同樣 replace 替代 copy 字符串到空間 find 查找 rfind 反向查找 find_first_of 查找包含子串中的任何字符,返回第一個位置 find_first_not_of 查找不包含子串中的任何字符,返回第一個位置 find_last_of 查找包含子串中的任何字符,返回最後一個位置 find_last_not_of 查找不包含子串中的任何字符,返回最後一個位置 substr 獲得字串 compare 比較字符串 operator+ 字符串連接 operator== 判斷是否相等 operator!= 判斷是否不等於 operator< 判斷是否小於 operator>> 從輸入流中讀入字符串 operator<< 字符串寫入輸出流 getline 從輸入流中讀入一行
///////////////////////////////////////////////////////////////////////////////////
之因此拋棄char*的字符串而選用C++標準程序庫中的string類,是由於他和前者比較起來,沒必要擔憂內存是否足夠、字符串長度等等,並且做 爲一個類出現,他集成的操做函數足以完成咱們大多數狀況下(甚至是100%)的須要。咱們能夠用 = 進行賦值操做,== 進行比較,+ 作串聯(是否是很簡單?)。咱們盡能夠把它當作是C++的基本數據類型。 好了,進入正題……… 首先,爲了在咱們的程序中使用string類型,咱們必須包含頭文件 。以下:
#include <string> //注意這裏不是string.h string.h是C字符串頭文件
1.聲明一個C++字符串 聲明一個字符串變量很簡單:
string Str;
這樣咱們就聲明瞭一個字符串變量,但既然是一個類,就有構造函數和析構函數。上面的聲明沒有傳入參數,因此就直接使用了string的默認的構造函數,這個函數所做的就是把Str初始化爲一個空字符串。String類的構造函數和析構函數以下:
a) string s; //生成一個空字符串s b) string s(str) //拷貝構造函數 生成str的複製品 c) string s(str,stridx) //將字符串str內「始於位置stridx」的部分看成字符串的初值 d) string s(str,stridx,strlen) //將字符串str內「始於stridx且長度頂多strlen」的部分做爲字符串的初值 e) string s(cstr) //將C字符串做爲s的初值 f) string s(chars,chars_len) //將C字符串前chars_len個字符做爲字符串s的初值。 g) string s(num,c) //生成一個字符串,包含num個c字符 h) string s(beg,end) //以區間beg;end(不包含end)內的字符做爲字符串s的初值 i) s.~string() //銷燬全部字符,釋放內存
都很簡單,我就不解釋了。
2.字符串操做函數 這裏是C++字符串的重點,我先把各類操做函數羅列出來,不喜歡把全部函數都看完的人能夠在這裏找本身喜歡的函數,再到後面看他的詳細解釋。
a) =,assign() //賦以新值 b) swap() //交換兩個字符串的內容 c) +=,append(),push_back() //在尾部添加字符 d) insert() //插入字符 e) erase() //刪除字符 f) clear() //刪除所有字符 g) replace() //替換字符 h) + //串聯字符串 i) ==,!=,<,<=,>,>=,compare() //比較字符串 j) size(),length() //返回字符數量 k) max_size() //返回字符的可能最大個數 l) empty() //判斷字符串是否爲空 m) capacity() //返回從新分配以前的字符容量 n) reserve() //保留必定量內存以容納必定數量的字符 o) [ ], at() //存取單一字符 p) >>,getline() //從stream讀取某值 q) << //將謀值寫入stream r) copy() //將某值賦值爲一個C_string s) c_str() //將內容以C_string返回 t) data() //將內容以字符數組形式返回 u) substr() //返回某個子字符串 v)查找函數 w)begin() end() //提供相似STL的迭代器支持 x) rbegin() rend() //逆向迭代器 y) get_allocator() //返回配置器
下面詳細介紹:
2.1 C++字符串和C字符串的轉換
C++提供的由C++字符串獲得對應的C_string的方法是使用data()、c_str()和copy(),其中,data()以字符數組的形式返回字符串內容,但並不添加’\0’。c_str()返回一個以‘\0’結尾的字符數組,而copy()則把字符串的內容複製或寫入既有的c_string 或字符數組內。C++字符串並不以’\0’結尾。個人建議是在程序中能使用C++字符串就使用,除非萬不得已不選用c_string。因爲只是簡單介紹,詳細介紹掠過,誰想進一步瞭解使用中的注意事項能夠給我留言(到個人收件箱)。我詳細解釋。
2.2 大小和容量函數 一個C++字符串存在三種大小:a)現有的字符數,函數是size()和length(),他們等效。Empty()用來檢查字符串是否爲空。 b)max_size() 這個大小是指當前C++字符串最多能包含的字符數,極可能和機器自己的限制或者字符串所在位置連續內存的大小有關係。咱們通常狀況下不用關心他,應該大小 足夠咱們用的。可是不夠用的話,會拋出length_error異常c)capacity()從新分配內存以前 string所能包含的最大字符數。這裏另外一個須要指出的是reserve()函數,這個函數爲string從新分配內存。從新分配的大小由其參數決定, 默認參數爲0,這時候會對string進行非強制性縮減。
還有必要再重複一下C++字符串和C字符串轉換的問題,許多人會遇到這樣的問題,本身作的程序要調用別人的函數、類什麼的(好比數據庫鏈接函數 Connect(char,char)),但別人的函數參數用的是char形式的,而咱們知道,c_str()、data()返回的字符數組由該字符串擁有,因此是一種const char,要想做爲上面說起的函數的參數,還必須拷貝到一個char,而咱們的原則是能不使用C字符串就不使用。那麼,這時候咱們的處理方式是:若是此函數對參數(也就是char)的內容不修改的話,咱們能夠這樣Connect((char)UserID.c_str(), (char)PassWD.c_str()),可是這時候是存在危險的,由於這樣轉換後的字符串實際上是能夠修改的(有興趣地能夠本身試一試),因此我強調除非函數調用的時候不對參數進行修改,不然必須拷貝到一個char上去。固然,更穩妥的辦法是不管什麼狀況都拷貝到一個char上去。同時咱們也祈禱如今仍然使用C字符串進行編程的高手們(說他們是高手一點兒也不爲過,也許在咱們還穿開襠褲的時候他們就開始編程了,哈哈…)寫的函數都比較規範,那樣咱們就沒必要進行強制轉換了。
2.3元素存取 咱們可使用下標操做符[]和函數at()對元素包含的字符進行訪問。可是應該注意的是操做符[]並不檢查索引是否有效(有效索引 0~str.length()),若是索引失效,會引發未定義的行爲。而at()會檢查,若是使用at()的時候索引無效,會拋出 out_of_range異常。 有一個例外不得不說,const string a;的操做符[]對索引值是a.length()仍然有效,其返回值是’\0’。其餘的各類狀況,a.length()索引都是無效的。舉例以下:
const string Cstr(「const string」); string Str(「string」); Str[3]; //ok Str.at(3); //ok Str[100]; //未定義的行爲 Str.at(100); //throw out_of_range Str[Str.length()] //未定義行爲 Cstr[Cstr.length()] //返回 ‘\0’ Str.at(Str.length());//throw out_of_range Cstr.at(Cstr.length()) ////throw out_of_range
我不同意相似於下面的引用或指針賦值: char& r=s[2]; char* p= &s[3];
由於一旦發生從新分配,r,p當即失效。避免的方法就是不使用。
2.4比較函數 C++字符串支持常見的比較操做符(>,>=,<,<=,==,!=),甚至支持string與C-string的比較(如 str<」hello」)。在使用>,>=,<,<=這些操做符的時候是根據「當前字符特性」將字符按字典順序進行逐一得 比較。字典排序靠前的字符小,比較的順序是從前向後比較,遇到不相等的字符就按這個位置上的兩個字符的比較結果肯定兩個字符串的大小。同 時,string(「aaaa」) <string(aaaaa)。 另外一個功能強大的比較函數是成員函數compare()。他支持多參數處理,支持用索引值和長度定位子串來進行比較。他返回一個整數來表示比較結果,返回 值意義以下:0-相等 〉0-大於 <0-小於。舉例以下:
string s(「abcd」); s.compare(「abcd」); //返回0 s.compare(「dcba」); //返回一個小於0的值 s.compare(「ab」); //返回大於0的值 s.compare(s); //相等 s.compare(0,2,s,2,2); //用」ab」和」cd」進行比較 小於零 s.compare(1,2,」bcx」,2); //用」bc」和」bc」比較。
怎麼樣?功可以全的吧!什麼?還不能知足你的胃口?好吧,那等着,後面有更個性化的比較算法。先給個提示,使用的是STL的比較算法。什麼?對STL一竅不通?你重修吧!
2.5 更改內容 這在字符串的操做中佔了很大一部分。 首先講賦值,第一個賦值方法固然是使用操做符=,新值能夠是string(如:s=ns) 、c_string(如:s=」gaint」)甚至單一字符(如:s=’j’)。還可使用成員函數assign(),這個成員函數可使你更靈活的對字符串賦值。仍是舉例說明吧:
s.assign(str); //直接 s.assign(str,1,3);//若是str是」iamangel」 就是把」ama」賦給字符串 s.assign(str,2,string::npos);//把字符串str從索引值2開始到結尾賦給s s.assign(「gaint」); //不說 s.assign(「nico」,5);//把’n’ ‘I’ ‘c’ ‘o’ ‘\0’賦給字符串 s.assign(5,’x’);//把五個x賦給字符串
把字符串清空的方法有三個:s=」」;s.clear();s.erase();(我愈來愈以爲舉例比說話讓別人容易懂!)。 string提供了不少函數用於插入(insert)、刪除(erase)、替換(replace)、增長字符。 先說增長字符(這裏說的增長是在尾巴上),函數有 +=、append()、push_back()。舉例以下:
s+=str;//加個字符串 s+=」my name is jiayp」;//加個C字符串 s+=’a’;//加個字符 s.append(str); s.append(str,1,3);//不解釋了 同前面的函數參數assign的解釋 s.append(str,2,string::npos)//不解釋了 s.append(「my name is jiayp」); s.append(「nico」,5); s.append(5,’x’); s.push_back(‘a’);//這個函數只能增長單個字符 對STL熟悉的理解起來很簡單
也許你須要在string中間的某個位置插入字符串,這時候你能夠用insert()函數,這個函數須要你指定一個安插位置的索引,被插入的字符串將放在這個索引的後面。
s.insert(0,」my name」); s.insert(1,str);
這種形式的insert()函數不支持傳入單個字符,這時的單個字符必須寫成字符串形式(讓人噁心)。既然你以爲噁心,那就不得不繼續讀下面一段 話:爲了插入單個字符,insert()函數提供了兩個對插入單個字符操做的重載函數:insert(size_type index,size_type num,chart c)和insert(iterator pos,size_type num,chart c)。其中size_type是無符號整數,iterator是char*,因此,你這麼調用insert函數是不行 的:insert(0,1,’j’);這時候第一個參數將轉換成哪個呢?因此你必須這麼 寫:insert((string::size_type)0,1,’j’)!第二種形式指出了使用迭代器安插字符的形式,在後面會說起。順便提一 下,string有不少操做是使用STL的迭代器的,他也儘可能作得和STL靠近。 刪除函數erase()的形式也有好幾種(真煩!),替換函數replace()也有好幾個。舉例吧:
string s=」il8n」; s.replace(1,2,」nternationalizatio」);//從索引1開始的2個替換成後面的C_string s.erase(13);//從索引13開始日後全刪除 s.erase(7,5);//從索引7開始日後刪5個
2.6提取子串和字符串鏈接
題取子串的函數是:substr(),形式以下:
s.substr();//返回s的所有內容 s.substr(11);//從索引11日後的子串 s.substr(5,6);//從索引5開始6個字符
把兩個字符串結合起來的函數是+。(誰不明白請致電120)
2.7輸入輸出操做 1.>> 從輸入流讀取一個string。 2.<< 把一個string寫入輸出流。 另外一個函數就是getline(),他從輸入流讀取一行內容,直到遇到分行符或到了文件尾。
2.8搜索與查找 查找函數不少,功能也很強大,包括了:
find() rfind() find_first_of() find_last_of() find_first_not_of() find_last_not_of()
這些函數返回符合搜索條件的字符區間內的第一個字符的索引,沒找到目標就返回npos。全部的函數的參數說明以下: 第一個參數是被搜尋的對象。第二個參數(無關緊要)指出string內的搜尋起點索引,第三個參數(無關緊要)指出搜尋的字符個數。比較簡單,很少說 不理解的能夠向我提出,我再仔細的解答。固然,更增強大的STL搜尋在後面會有說起。 最後再說說npos的含義,string::npos的類型是string::size_type,因此,一旦須要把一個索引與npos相比,這個索引值 必須是string::size)type類型的,更多的狀況下,咱們能夠直接把函數和npos進行比較 (如:if(s.find(「jia」)==string::npos))。
任何人對本文進行引用都要標明做者是Nicolai M.Josuttis 譯者是侯捷/孟巖