深刻理解PHP之數組(遍歷順序)

常常會有人問我, PHP的數組, 若是用foreach來訪問, 遍歷的順序是固定的麼? 以什麼順序遍歷呢?
好比:php

 
  1. <?php
  2. $arr['laruence'] = 'huixinchen';
  3. $arr['yahoo'] = 2007;
  4. $arr['baidu'] = 2008;
  5. foreach ($arr as $key => $val) {
  6. //結果是什麼?
  7. }

又好比:html

 
  1. <?php
  2. $arr[2] = 'huixinchen';
  3. $arr[1] = 2007;
  4. $arr[0] = 2008;
  5. foreach ($arr as $key => $val) {
  6. //如今結果又是什麼?
  7. }

要徹底瞭解清楚這個問題, 我想首先應該要你們瞭解PHP數組的內部實現結構………算法

PHP的數組

在PHP中, 數組是用一種HASH結構(HashTable)來實現的, PHP使用了一些機制, 使得能夠在O(1)的時間複雜度下實現數組的增刪, 並同時支持線性遍歷和隨機訪問.數組

以前的文章中也討論過, PHP的HASH算法, 基於此, 咱們作進一步的延伸.app

認識HashTable以前, 首先讓咱們看看HashTable的結構定義, 我加了註釋方便你們理解:wordpress

 
  1. typedef struct _hashtable {
  2. uint nTableSize; /* 散列表大小, Hash值的區間 */
  3. uint nTableMask; /* 等於nTableSize -1, 用於快速定位 */
  4. uint nNumOfElements; /* HashTable中實際元素的個數 */
  5. ulong nNextFreeElement; /* 下個空閒可用位置的數字索引 */
  6. Bucket *pInternalPointer; /* 內部位置指針, 會被reset, current這些遍歷函數使用 */
  7. Bucket *pListHead; /* 頭元素, 用於線性遍歷 */
  8. Bucket *pListTail; /* 尾元素, 用於線性遍歷 */
  9. Bucket **arBuckets; /* 實際的存儲容器 */
  10. dtor_func_t pDestructor;/* 元素的析構函數(指針) */
  11. zend_bool persistent;
  12. unsigned char nApplyCount; /* 循環遍歷保護 */
  13. zend_bool bApplyProtection;
  14. #if ZEND_DEBUG
  15. int inconsistent;
  16. #endif
  17. } HashTable;

關於nApplyCount的意義, 咱們能夠經過一個例子來了解:函數

 
  1. <?php
  2.     $arr = array(1,2,3,4,5,);
  3.     $arr[] = &$arr;
  4.  
  5.     var_export($arr); //Fatal error: Nesting level too deep - recursive dependency?

這個字段就是爲了防治循環引用致使的無限循環而設立的.flex

查看上面的結構, 能夠看出, 對於HashTable, 關鍵元素就是arBuckets了, 這個是實際存儲的容器, 讓咱們來看看它的結構定義:ui

 
  1. typedef struct bucket {
  2. ulong h; /* 數字索引/hash值 */
  3. uint nKeyLength; /* 字符索引的長度 */
  4. void *pData; /* 數據 */
  5. void *pDataPtr; /* 數據指針 */
  6. struct bucket *pListNext; /* 下一個元素, 用於線性遍歷 */
  7. struct bucket *pListLast; /* 上一個元素, 用於線性遍歷 */
  8. struct bucket *pNext; /* 處於同一個拉鍊中的下一個元素 */
  9. struct bucket *pLast; /* 處於同一拉鍊中的上一個元素 */
  10. char arKey[1]; /* 節省內存,方便初始化的技巧 */
  11. } Bucket;

咱們注意到, 最後一個元素, 這個是flexible array技巧, 能夠節省內存,和方便初始化的一種作法, 有興趣的朋友能夠google flexible array.google

h是元素的Hash值,對於數字索引的元素,h爲直接索引值(經過nKeyLength=0來表示是數字索引).而對於字符串索引來講, 索引值保存在arKey中, 索引的長度保存在nKeyLength中.

在Bucket中,實際的數據是保存在pData指針指向的內存塊中,一般這個內存塊是系統另外分配的。但有一種狀況例外,就是當Bucket保存 的數據是一個指針時,HashTable將不會另外請求系統分配空間來保存這個指針,而是直接將該指針保存到pDataPtr中,而後再將pData指向本結構成員的地址。這樣能夠提升效率,減小內存碎片。由此咱們能夠看到PHP HashTable設計的精妙之處。若是Bucket中的數據不是一個指針,pDataPtr爲NULL(本段來自Altair的」Zend HashTable詳解」)

結合上面的HashTable結構, 咱們來講明下HashTable的總結構圖:

HashTable結構示意圖

HashTable結構示意圖

 

HashTable的pListhHead指向線性列表形式下的第一個元素, 上圖中是元素1, pListTail指向的是最後一個元素0, 而對於每個元素pListNext就是紅色線條畫出的線性結構的下一個元素, 而pListLast是上一個元素.

pInternalPointer指向當前的內部指針的位置, 在對數組進行順序遍歷的時候, 這個指針指明瞭當前的元素.

當在線性(順序)遍歷的時候, 就會從pListHead開始, 順着Bucket中的pListNext/pListLast, 根據移動pInternalPointer, 來實現對全部元素的線性遍歷.

好比, 對於foreach, 若是咱們查看它生成的opcode序列, 咱們能夠發現, 在foreach以前, 會首先有個FE_RESET來重置數組的內部指針, 也就是pInternalPointer(關於foreach能夠參看深刻理解PHP原理之foreach), 而後經過每次FE_FETCH來遞增pInternalPointer,從而實現順序遍歷.

相似的, 當咱們使用, each/next系列函數來遍歷的時候, 也是經過移動數組的內部指針而實現了順序遍歷, 這裏有一個問題, 好比:

 
  1. <?php
  2. $arr = array(1,2,3,4,5);
  3. foreach ($arr as $v) {
  4. //能夠獲取
  5. }
  6.  
  7. while (list($key, $v) = each($arr)) {
  8. //獲取不到
  9. }
  10. ?>

瞭解到我剛纔介紹的知識, 那麼這個問題也就很明朗了, 由於foreach會自動reset, 而while這塊不會reset, 因此在foreach結束之後, pInternalPointer指向數組最末端, while語句塊固然訪問不到了, 解決的辦法就是在each以前, 先reset數組的內部指針.

而在隨機訪問的時候, 就會經過hash值肯定在hash數組中的頭指針位置, 而後經過pNext/pLast來找到特色元素.

增長元素的時候, 元素會插在相同Hash元素鏈的頭部和線性列表的尾部. 也就是說, 元素在線性遍歷的時候是根據插入的前後順序來遍歷的, 這個特殊的設計使得在PHP中,當使用數字索引時, 元素的前後順序是由添加的順序決定的,而不是索引順序.

也就是說, PHP中遍歷數組的順序, 是和元素的添加前後相關的, 那麼, 如今咱們就很清楚的知道, 文章開頭的問題的輸出是:

 
  1. huixinchen
  2. 2007
  3. 2008

因此, 若是你想在數字索引的數組中按照索引大小遍歷, 那麼你就應該使用for, 而不是foreach

 
  1. for($i=0,$l=count($arr); $i<$l; $i++) {
  2.  //這個時候,不能認爲是順序遍歷(線性遍歷)
  3. }

PHP中遍歷數組的順序, 是和元素的添加前後相關的,若是你想在數字索引的數組中按照索引大小遍歷, 那麼你就應該使用for, 而不是foreach

相關文章
相關標籤/搜索