C++的中英文字符串表示(string,wstring)

  在C++中字符串類的string的模板原型是basic_stringios

 

template <class _Elem, class traits = char_traits<_Elem>, class _Ax = allocator<_Elem>>
class basic_string{ };

 

     第一個參數_Elem表示類型。第二個參數traits的缺省值使用char_traits類型,定義了類型和字符操做的函數,如比較、等價、分配等。第三個參數_Ax的默認值是allocator類,表示了內存模式,不一樣的內存結構將操做指針的不一樣行爲,例如棧、堆或段內存模式等。函數

     在C++標準裏定義了兩個字符串string和wstring編碼

typedef basic_string<char> string;
typedef basic_string<wchar_t> wstring;

 

     前者string是經常使用類型,能夠看做char[],其實這正是與string定義中的_Elem=char相一致。而wstring,使用的是wchar_t類型,這是寬字符,用於知足非ASCII字符的要求,例如Unicode編碼,中文,日文,韓文什麼的。對於wchar_t類型,實際上C++中都用與char函數相對應的wchar_t的函數,由於他們都是從同一個模板相似於上面的方式定義的。所以也有wcout, wcin, werr等函數。spa

     實際上string也能夠使用中文,可是它將一個漢字寫在2個char中。而若是將一個漢字看做一個單位wchar_t的話,那麼在wstring中就只佔用一個單元,其它的非英文文字和編碼也是如此。這樣才真正的知足字符串操做的要求,尤爲是國際化等工做。指針

     看一下下面的程序,就會理解二者的差異。code

 

複製代碼
#include <iostream>
#include <string>
using namespace std;

#define tab "\t"

int main()
{
    locale def;
    cout<<def.name()<<endl;
    locale current = cout.getloc();
    cout<<current.name()<<endl;

    float val=1234.56;
    cout<<val<<endl;

    //chage to french/france
    cout.imbue(locale("chs"));
    current=cout.getloc();
    cout<<current.name()<<endl;
    cout<<val<<endl;

    //上面是說明locale的用法,下面纔是本例的內容,由於其中用到了imbue函數
    cout<<"*********************************"<<endl;

    //爲了保證本地化輸出(文字/時間/貨幣等),chs表示中國,wcout必須使用本地化解析編碼
    wcout.imbue(std::locale("chs"));

    //string 英文,正確顛倒位置,顯示第二個字符正確
    string str1("ABCabc");
    string str11(str1.rbegin(),str1.rend());
    cout<<"UK\ts1\t:"<<str1<<tab<<str1[1]<<tab<<str11<<endl;

    //wstring 英文,正確顛倒位置,顯示第二個字符正確
    wstring str2=L"ABCabc";
    wstring str22(str2.rbegin(),str2.rend());
    wcout<<"UK\tws4\t:"<<str2<<tab<<str2[1]<<tab<<str22<<endl;

    //string 中文,顛倒後,變成亂碼,第二個字符讀取也錯誤
    string str3("你好麼?");
    string str33(str3.rbegin(),str3.rend());
    cout<<"CHN\ts3\t:"<<str3<<tab<<str3[1]<<tab<<str33<<endl;

    //正確的打印第二個字符的方法
    cout<<"CHN\ts3\t:RIGHT\t"<<str3[2]<<str3[3]<<endl;

    //中文,正確顛倒位置,顯示第二個字符正確
    wstring str4=L"你好麼?";
    wstring str44(str4.rbegin(),str4.rend());
    wcout<<"CHN\tws4\t:"<<str4<<tab<<str4[1]<<tab<<str44<<endl;

    wstring str5(str1.begin(),str1.end());//只有char類型的string時才能夠如此構造
    wstring str55(str5.rbegin(),str5.rend());
    wcout<<"CHN\tws5\t:"<<str5<<tab<<str5[1]<<tab<<str55<<endl;

    wstring str6(str3.begin(),str3.end());//如此構造將失敗!!!!
    wstring str66(str6.rbegin(),str6.rend());
    wcout<<"CHN\tws6\t:"<<str6<<tab<<str6[1]<<tab<<str66<<endl;

    return 0;
}

複製代碼
相關文章
相關標籤/搜索