你們好,我是小賀。ios
點贊再看,養成習慣c++
文章每週持續更新,能夠微信搜索「herongwei」第一時間閱讀和催更,本文 GitHub : https://github.com/rongweihe/MoreThanCPlusPlus 已經收錄,有一線大廠面試點思惟導圖,也整理了不少個人文檔,歡迎 star 和完善。一塊兒加油,變得更好!git
上一篇,咱們剖析了 STL 空間配置器,這一篇文章,咱們來學習下 STL 迭代器以及背後的 traits 編程技法。github
在 STL 編程中,容器和算法是獨立設計的,容器裏面存的是數據,而算法則是提供了對數據的操做,在算法操做數據的過程當中,要用到迭代器,迭代器能夠看作是容器和算法中間的橋樑。面試
爲什麼說迭代器的時候,還談到了設計模式?這個迭代器和設計模式又有什麼關係呢?算法
其實,在《設計模式:可複用面向對象軟件的基礎》(GOF)這本經典書中,談到了 23 種設計模式,其中就有 iterator 迭代模式,且篇幅頗大。編程
碰巧,筆者在研究 STL 源碼的時候,一樣的發現有 iterator 迭代器,並且還佔據了一章的篇幅。設計模式
在設計模式中,關於 iterator 的描述以下:一種可以順序訪問容器中每一個元素的方法,使用該方法不能暴露容器內部的表達方式。而類型萃取技術就是爲了要解決和 iterator 有關的問題的。微信
有了上面這個基礎,咱們就知道了迭代器自己也是一種設計模式,其設計思想值得咱們仔細體會。dom
那麼 C++ STL 實現 iterator 和 GOF 介紹的迭代器實現方法什麼區別呢? 那首先咱們須要瞭解 C++ 中的兩個編程範式的概念,OOP(面向對象編程)和 GP(泛型編程)。
在 C++ 語言裏面,咱們可用如下方式來簡單區分一下 OOP 和 GP :
OOP:將 methods 和 datas 關聯到一塊兒 (通俗點就是方法和成員變量放到一個類中實現),經過繼承的方式,利用虛函數表(virtual)來實現運行時類型的斷定,也叫"動態多態",因爲運行過程當中需根據類型去檢索虛函數表,所以效率相對較低。
GP:泛型編程,也被稱爲"靜態多態",多種數據類型在同一種算法或者結構上皆可操做,其效率與針對某特定數據類型而設計的算法或者結構相同, 具體數據類型在編譯期肯定,編譯器承擔更多,代碼執行效率高。在 STL 中利用 GP 將 methods 和 datas 實現了分而治之。
而 C++ STL 庫的整個實現採用的就是 GP(Generic Programming),而不是 OOP(Object Oriented Programming)。而 GOF 設計模式採用的就是繼承關係實現的,所以,相對來說,C++ STL 的實現效率會相對較高,並且也更有利於維護。
在 STL 編程結構裏面,迭代器其實也是一種模板 class
,迭代器在 STL 中獲得了普遍的應用,經過迭代器,容器和算法能夠有機的綁定在一塊兒,只要對算法給予不一樣的迭代器,好比 vector::iterator、list::iterator,std::find()
就能對不一樣的容器進行查找,而無需針對某個容器來設計多個版本。
這樣看來,迭代器彷佛依附在容器之下,那麼,有沒有獨立而適用於全部容器的泛化的迭代器呢?這個問題先留着,在後面咱們會看到,在 STL 編程結構裏面,它是如何把迭代器運用的爐火純青。
STL 是泛型編程思想的產物,是以泛型編程爲指導而產生的。具體來講,STL 中的迭代器將範型算法 (find, count, find_if)
等應用於某個容器中,給算法提供一個訪問容器元素的工具,iterator
就扮演着這個重要的角色。
稍微看過 STL 迭代器源碼的,就明白迭代器其實也是一種智能指針,所以,它也就擁有了通常指針的全部特色—— 可以對其進行 *
和 ->
操做。
template<typename T> class ListIterator {//mylist迭代器 public: ListIterator(T *p = 0) : m_ptr(p){} //構造函數 T& operator*() const { return *m_ptr;} //取值,即dereference T* operator->() const { return m_ptr;} //成員訪問,即member access //... };
可是在遍歷容器的時候,不可避免的要對遍歷的容器內部有所瞭解,因此,乾脆把迭代器的開發工做交給容器的設計者,如此以來,全部實現細節反而得以封裝起來不被使用者看到,這也正是爲何每一種 STL 容器都提供有專屬迭代器的緣故。
好比筆者本身實現的 list
迭代器在這裏使用的好處主要有:
list
,取下一個元素不是經過自增而是經過 next
指針來取,使用智能指針能夠對自增進行重載,從而提供統一接口。參數推導能幫咱們解決什麼問題呢?
在算法中,你可能會定義一個簡單的中間變量或者設定算法的返回變量類型,這時候,你可能會遇到這樣的問題,假如你須要知道迭代器所指元素的類型是什麼,進而獲取這個迭代器操做的算法的返回類型,可是問題是 C++
沒有 typeof
這類判斷類型的函數,也沒法直接獲取,那該如何是好?
注意是類型,不是迭代器的值,雖然 C++
提供了一個 typeid()
操做符,這個操做符只能得到型別的名稱,但不能用來聲明變量。要想得到迭代器型別,這個時候又該如何是好呢?
function template
的參數推導機制是一個不錯的方法。
例如:
若是 I
是某個指向特定對象的指針,那麼在 func 中須要指針所指向對象的型別的時候,怎麼辦呢?這個還比較容易,模板的參數推導機制能夠完成任務,
template <class I> inline void func(I iter) { func_imp(iter, *iter); // 傳入 iter 和 iter 所指的值,class 自動推導 }
經過模板的推導機制,就能垂手可得的得到指針所指向的對象的類型。
template <class I, class T> void func_imp(I iter, T t) { T tmp; // 這裏就是迭代器所指物的類別 // ... 功能實現 } int main() { int i; func(&i);//這裏傳入的是一個迭代器(原生指針也是一種迭代器) }
上面的作法呢,經過多層的迭代,很巧妙地導出了 T
,可是卻頗有侷限性,好比,我但願 func()
返回迭代器的 value type
類型返回值, 函數的 "template
參數推導機制" 推導的只是參數,沒法推導函數的返回值類型。萬一須要推導函數的返回值,好像就不行了,那麼又該如何是好?
這就引出了下面的內嵌型別。
上述所說的 迭代器所指對象的型別,稱之爲迭代器的 value type
。
儘管在 func_impl
中咱們能夠把 T
做爲函數的返回值,可是問題是用戶須要調用的是 func
。
若是在參數推導機制上加上內嵌型別 (typedef)
呢?爲指定的對象類型定義一個別名,而後直接獲取,這樣來看一下實現:
template<typename T> class MyIter { public: typedef T value_type; //內嵌類型聲明 MyIter(T *p = 0) : m_ptr(p) {} T& operator*() const { return *m_ptr;} private: T *m_ptr; }; //以迭代器所指對象的類型做爲返回類型 //注意typename是必須的,它告訴編譯器這是一個類型 template<typename MyIter> typename MyIter::value_type Func(MyIter iter) { return *iter; } int main(int argc, const char *argv[]) { MyIter<int> iter(new int(666)); std::cout<<Func(iter)<<std::endl; //print=> 666 }
上面的解決方案看着可行,但其實呢,實際上仍是有問題,這裏有一個隱晦的陷阱:實際上並非全部的迭代器都是 class type
,原生指針也是一種迭代器,因爲原生指針不是 class type
,因此無法爲它定義內嵌型別。
由於 func
若是是一個泛型算法,那麼它也絕對要接受一個原生指針做爲迭代器,下面的代碼編譯無法經過:
int *p = new int(5); cout<<Func(p)<<endl; // error
要解決這個問題,Partial specialization
(模板偏特化)就出場了。
所謂偏特化是指若是一個 class template
擁有一個以上的 template
參數,咱們能夠針對其中某個(或多個,但不是所有)template
參數進行特化,好比下面這個例子:
template <typename T> class C {...}; //此泛化版本的 T 能夠是任何類型 template <typename T> class C<T*> {...}; //特化版本,僅僅適用於 T 爲「原生指針」的狀況,是泛化版本的限制版
所謂特化,就是特殊狀況特殊處理,第一個類爲泛化版本,T
能夠是任意類型,第二個類爲特化版本,是第一個類的特殊狀況,只針對原生指針。
還記得前面說過的參數推導機制+內嵌型別機制獲取型別有什麼問題嗎?問題就在於原生指針雖然是迭代器但不是class
,沒法定義內嵌型別,而偏特化彷佛能夠解決這個問題。
有了上面的認識,咱們再看看 STL
是如何應用的。STL
定義了下面的類模板,它專門用來「萃取」迭代器的特性,而value type
正是迭代器的特性之一:
traits
在 bits/stl_iterator_base_types.h
這個文件中:
template<class _Tp> struct iterator_traits<_Tp*> { typedef ptrdiff_t difference_type; typedef typename _Tp::value_type value_type; typedef typename _Tp::pointer pointer; typedef typename _Tp::reference reference; typedef typename _Tp::iterator_category iterator_category; };
template<typename Iterator> struct iterator_traits { //類型萃取機 typedef typename Iterator::value_type value_type; //value_type 就是 Iterator 的類型型別 }
加入萃取機先後的變化:
template<typename Iterator> //萃取前 typename Iterator::value_type func(Iterator iter) { return *iter; } //經過 iterator_traits 做用後的版本 template<typename Iterator> //萃取後 typename iterator_traits<Iterator>::value_type func(Iterator iter) { return *iter; }
看到這裏也許你會問了,這個萃取前和萃取後的 typename :iterator_traits::value_type
跟 Iterator::value_type
看起來同樣啊,爲何還要增長 iterator_traits
這一層封裝,豈不是畫蛇添足?
回想萃取以前的版本有什麼缺陷:不支持原生指針。而經過萃取機的封裝,咱們能夠經過類模板的特化來支持原生指針的版本!如此一來,不管是智能指針,仍是原生指針,iterator_traits::value_type 都能起做用,這就解決了前面的問題。
//iterator_traits的偏特化版本,針對迭代器是原生指針的狀況 template<typename T> struct iterator_traits<T*> { typedef T value_type; };
看到這裏,咱們不得不佩服的 STL 的設計者們,真·秒啊!咱們用下面這張圖來總結一下前面的流程:
經過偏特化添加一層中間轉換的 traits 模板 class,能實現對原生指針和迭代器的支持,有的讀者可能會繼續追問:對於指向常數對象的指針又該怎麼處理呢?好比下面的例子:
iterator_traits<const int*>::value_type // 得到的 value_type 是 const int,而不是 int
const 變量只能初始化,而不能賦值(這兩個概念必須區分清楚)。這將帶來下面的問題:
template<typename Iterator> typename iterator_traits<Iterator>::value_type func(Iterator iter) { typename iterator_traits<Iterator>::value_type tmp; tmp = *iter; // 編譯 error } int val = 666 ; const int *p = &val; func(p); // 這時函數裏對 tmp 的賦值都將是不容許的
那該如何是好呢?答案仍是偏特化,來看實現:
template<typename T> struct iterator_traits<const T*> { //特化const指針 typedef T value_type; //獲得T而不是const T }
經過上面幾節的介紹,咱們知道,所謂的 traits 編程技法無非 就是增長一層中間的模板 class
,以解決獲取迭代器的型別中的原生指針問題。利用一箇中間層 iterator_traits
固定了 func
的形式,使得重複的代碼大量減小,惟一要作的就是稍稍特化一下 iterator_tartis
使其支持 pointer
和 const pointer
。
#include <iostream> template <class T> struct MyIter { typedef T value_type; // 內嵌型別聲明 T* ptr; MyIter(T* p = 0) : ptr(p) {} T& operator*() const { return *ptr; } }; // class type template <class T> struct my_iterator_traits { typedef typename T::value_type value_type; }; // 偏特化 1 template <class T> struct my_iterator_traits<T*> { typedef T value_type; }; // 偏特化 2 template <class T> struct my_iterator_traits<const T*> { typedef T value_type; }; // 首先詢問 iterator_traits<I>::value_type,若是傳遞的 I 爲指針,則進入特化版本,iterator_traits 直接回答;若是傳遞進來的 I 爲 class type,就去詢問 T::value_type. template <class I> typename my_iterator_traits<I>::value_type Func(I ite) { std::cout << "normal version" << std::endl; return *ite; } int main(int argc, const char *argv[]) { MyIter<int> ite(new int(6)); std::cout << Func(ite)<<std::endl;//print=> 6 int *p = new int(7); std::cout<<Func(p)<<std::endl;//print=> 7 const int k = 8; std::cout<<Func(&k)<<std::endl;//print=> 8 }
上述的過程是首先詢問 iterator_traits::value_type
,若是傳遞的 I 爲指針,則進入特化版本, iterator_traits
直接回答T
;若是傳遞進來的 I
爲 class type
,就去詢問 T::value_type
。
通俗的解釋能夠參照下圖:
總結:核心知識點在於 模板參數推導機制+內嵌類型定義機制, 爲了能處理原生指針這種特殊的迭代器,引入了偏特化機制。traits
就像一臺 「特性萃取機」,把迭代器放進去,就能榨取出迭代器的特性。
這種偏特化是針對可調用函數 func
的偏特化,想象一種極端狀況,假如 func
有幾百萬行代碼,那麼若是不這樣作的話,就會形成很是大的代碼污染。同時增長了代碼冗餘。
咱們再來看看迭代器的型別,常見迭代器相應型別有 5 種:
value_type
:迭代器所指對象的類型,原生指針也是一種迭代器,對於原生指針 int*,int 即爲指針所指對象的類型,也就是所謂的 value_type 。
difference_type
: 用來表示兩個迭代器之間的距離,對於原生指針,STL 以 C++ 內建的 ptrdiff_t 做爲原生指針的 difference_type。
reference_type
: 是指迭代器所指對象的類型的引用,reference_type 通常用在迭代器的 * 運算符重載上,若是 value_type 是 T,那麼對應的 reference_type 就是 T&;若是 value_type 是 const T,那麼對應的reference_type 就是 const T&。
pointer_type
: 就是相應的指針類型,對於指針來講,最經常使用的功能就是 operator* 和 operator-> 兩個運算符。
iterator_category
: 的做用是標識迭代器的移動特性和能夠對迭代器執行的操做,從 iterator_category 上,可將迭代器分爲 Input Iterator、Output Iterator、Forward Iterator、Bidirectional Iterator、Random Access Iterator 五類,這樣分能夠儘量地提升效率。
template<typename Category, typename T, typename Distance = ptrdiff_t, typename Pointer = T*, typename Reference = T&> struct iterator //迭代器的定義 { typedef Category iterator_category; typedef T value_type; typedef Distance difference_type; typedef Pointer pointer; typedef Reference reference; };
iterator class 不包含任何成員變量,只有類型的定義,所以不會增長額外的負擔。因爲後面三個類型都有默認值,在繼承它的時候,只須要提供前兩個參數就能夠了。這個類主要是用來繼承的,在實現具體的迭代器時,能夠繼承上面的類,這樣子就不會漏掉上面的 5 個型別了。
對應的迭代器萃取機設計以下:
tempalte<typename I> struct iterator_traits {//特性萃取機,萃取迭代器特性 typedef typename I::iterator_category iterator_category; typedef typename I::value_type value_type; typedef typeanme I:difference_type difference_type; typedef typename I::pointer pointer; typedef typename I::reference reference; }; //須要對型別爲指針和 const 指針設計特化版本看
最後,咱們來看看,迭代器型別 iterator_category
對應的迭代器類別,這個類別會限制迭代器的操做和移動特性。
除了原生指針之外,迭代器被分爲五類:
Input Iterator
: 此迭代器不容許修改所指的對象,是隻讀的。支持 ==、!=、++、*、-> 等操做。Output Iterator
:容許算法在這種迭代器所造成的區間上進行只寫操做。支持 ++、* 等操做。Forward Iterator
:容許算法在這種迭代器所造成的區間上進行讀寫操做,但只能單向移動,每次只能移動一步。支持 Input Iterator 和 Output Iterator 的全部操做。Bidirectional Iterator
:容許算法在這種迭代器所造成的區間上進行讀寫操做,可雙向移動,每次只能移動一步。支持 Forward Iterator 的全部操做,並另外支持 – 操做。Random Access Iterator
:包含指針的全部操做,可進行隨機訪問,隨意移動指定的步數。支持前面四種 Iterator 的全部操做,並另外支持 [n] 操做符等操做。那麼,這裏,小賀想問你們,爲何咱們要對迭代器進行分類呢?迭代器在具體的容器裏是到底如何運用的呢?這個問題就放到下一節在講。
最最後,咱們再來回顧一下六大組件的關係:
這六大組件的交互關係:container(容器) 經過 allocator(配置器) 取得數據儲存空間,algorithm(算法)經過 iterator(迭代器)存取 container(容器) 內容,functor(仿函數) 能夠協助 algorithm(算法) 完成不一樣的策略變化,adapter(配接器) 能夠修飾或套接 functor(仿函數)。
參考文章:
若是以爲文章對你有幫助,歡迎分享給你的朋友,一鍵三連,謝謝各位。 我是 herongwei ,是男人,就對本身狠一點,祝你們工做愉快,咱們下期見。