C++中string類的正確寫法

C++ 的一個常見面試題是讓你實現一個 String 類,限於時間,不可能要求具有 std::string 的功能,但至少要求能正確管理資源。具體來講:面試

  1. 能像 int 類型那樣定義變量,而且支持賦值、複製。編程

  2. 能用做函數的參數類型及返回類型。函數

  3. 能用做標準庫容器的元素類型,即 vector/list/deque 的 value_type。(用做 std::map 的 key_type 是更進一步的要求,本文從略)。性能

換言之,你的 String 能讓如下代碼編譯運行經過,而且沒有內存方面的錯誤。this

void foo(String x)
{
}

void bar(const String& x)
{
}

String baz()
{
  String ret("world");
  return ret;
}

int main()
{
  String s0;
  String s1("hello");
  String s2(s0);
  String s3 = s1;
  s2 = s1;

  foo(s1);
  bar(s1);
  foo("temporary");
  bar("temporary");
  String s4 = baz();

  std::vector<String> svec;
  svec.push_back(s0);
  svec.push_back(s1);
  svec.push_back(baz());
  svec.push_back("good job");
}

本文給出我認爲適合面試的答案,強調正確性及易實現(白板上寫也不會錯),不強調效率。某種意義上能夠說是以時間(運行快慢)換空間(代碼簡潔)。spa

首先選擇數據成員,最簡單的 String 只有一個 char* 成員變量。好處是容易實現,壞處是某些操做的複雜度較高(例如 size() 會是線性時間)。爲了面試時寫代碼不出錯,本文設計的 String 只有一個 char* data_成員。並且規定 invariant 以下:一個 valid 的 string 對象的 data_ 保證不爲 NULL,data_ 以 '\0' 結尾,以方便配合 C 語言的 str*() 系列函數。.net

其次決定支持哪些操做,構造、析構、拷貝構造、賦值這幾樣是確定要有的(之前合稱 big three,如今叫 copy control)。若是鑽得深一點,C++11的移動構造和移動賦值也能夠有。爲了突出重點,本文就不考慮 operator[] 之類的重載了。設計

這樣代碼基本上就定型了:code

#include <utility>
#include <string.h>

class String
{
 public:
  String()
    : data_(new char[1])
  {
    *data_ = '\0';
  }

  String(const char* str)
    : data_(new char[strlen(str) + 1])
  {
    strcpy(data_, str);
  }

  String(const String& rhs)
    : data_(new char[rhs.size() + 1])
  {
    strcpy(data_, rhs.c_str());
  }
  /* Delegate constructor in C++11
  String(const String& rhs)
    : String(rhs.data_)
  {
  }
  */

  ~String()
  {
    delete[] data_;
  }

  /* Traditional:
  String& operator=(const String& rhs)
  {
    String tmp(rhs);
    swap(tmp);
    return *this;
  }
  */
  String& operator=(String rhs) // yes, pass-by-value
  {
    swap(rhs);
    return *this;
  }

  // C++ 11
  String(String&& rhs)
    : data_(rhs.data_)
  {
    rhs.data_ = nullptr;
  }

  String& operator=(String&& rhs)
  {
    swap(rhs);
    return *this;
  }

  // Accessors

  size_t size() const
  {
    return strlen(data_);
  }

  const char* c_str() const
  {
    return data_;
  }

  void swap(String& rhs)
  {
    std::swap(data_, rhs.data_);
  }

 private:
  char* data_;
};

注意代碼的幾個要點:對象

  1. 只在構造函數裏調用 new char[],只在析構函數裏調用 delete[]。

  2. 賦值操做符采用了《C++編程規範》推薦的現代寫法。

  3. 每一個函數都只有一兩行代碼,沒有條件判斷。

  4. 析構函數沒必要檢查 data_ 是否爲 NULL。

  5. 構造函數 String(const char* str) 沒有檢查 str 的合法性,這是一個永無止境的爭論話題。這裏在初始化列表裏就用到了 str,所以在函數體內用 assert() 是無心義的。

這恐怕是最簡潔的 String 實現了。

練習1:增長 operator==、operator<、operator[] 等操做符重載。

練習2:實現一個帶 int size_; 成員的版本,以空間換時間。

練習3:受益於右值引用及移動語意,在 C++11 中對 String 實施直接插入排序的性能比C++98/03要高,試編程驗證之。(g++的標準庫也用到了此技術。)

陳皓注:同時,你們能夠移步看看個人一篇老文《STL中String類的問題

相關文章
相關標籤/搜索