研究方向的重要性(有意義):算法
城市土地使用信息在城市管理、政府政策制定、和人類活動監測方面扮演着重要的角色。微信
However,存在的困難:網絡
因爲城市系統的複雜性,將城市功能區正確分類是一件具備挑戰性的事情。app
與此項研究課題相關的其餘研究的作法:框架
許多研究都是從高分辨率遙感影像或者社交媒體數據提取出特徵,並對特徵進行對比分析來進行土地使用的分類。可是因爲缺少有效的模型,不多有研究將這兩個特徵同時考慮機器學習
本研究提出的方法:函數
咱們提出了一種新奇的場景分類的框架在交通分析區水平上來鑑別主要的城市土地利用模式。這個框架是整合機率主題模型和支持向量機(SVM)。在這個框架中的土地使用字典是經過融合從高分辨率遙感圖像中提取出來的天然物理特徵和從多元社交媒體數據中的社會經濟語義特徵。除了與人工解譯做比較,咱們設計了幾個實驗來檢測提出的模型對於先前獲得的語義特徵的不一樣組合所反應的不一樣土地使用分類正確性。工具
分類結果(整體正確率0.865,Kappa指數0.828)顯示咱們所提出策略的有效性--混合從多源地理空間數據提取的特徵做爲語義特徵來訓練分類模型。post
這個方法能夠被應用於幫助城市策劃者分析精細的城市結構和監視城市土地使用變化。而且在將來從多源數據獲得的其餘數據將會融合進這個提出的框架中。
介紹
①城市土地使用模式
LULC(土地使用和土地覆蓋):
土地使用和土地覆蓋信息包含許多領域重要的地域空間特徵,例如,城市規劃,政府管理,和可持續發展。
城市土地使用模式:
中國經濟和城市的快速發展生成了多種多樣複雜的城市功能區,功能區反映了城市土地使用模式。
土地使用模式不只受政府政策的影響,也受隨城市發展而持續改變的室內生活方式的影響。
Therefore,土地使用模式的有效檢測對於制定有效的城市規劃很是重要。在近期的研究中,土地使用模式的有效檢測是一個有爭議的話題。
②利用HSR遙感影像進行LULC的檢測。
在最近的研究中,HSR影像分類模型能夠普遍地應用於提取和分析土地使用和土地覆蓋(LULC)。LULC的分析主要由三個空間單元組成:像素,物體 和場景。物體用來評估土地覆蓋,場景常常用於鑑別城市功能區和評價城市土地使用模式。
許多研究採用面向對象分類(OOC)模式經過地物的物理特徵(例如光譜,形狀和質地特徵)來提取城市土地使用模式。However,OOC模型常常忽視地物的空間分佈及語義特徵,由於它們旨在挖掘地物低級語義土地覆蓋信息。
因爲在挖掘足夠的信息方面存在困難,上述傳統分類模型很難使用傳統遙感分類模型分類出的典型專題特徵去鑑別土地使用分類。困難是因爲跨越「語義鴻溝」的問題。
③高、低級語義特徵對比
簡單來講,低等級語義特徵代表「信息」直接來源於數據,而高等級語義特徵指的是指針對每一個用戶和應用程序的「知識」。語義鴻溝指的是這兩個級別之間特定的功能差別。
在圖像解譯的領域,低等級語義特徵直接從影像數據中提取,例如顏色和紋理,只可以表達物理屬性。 不一樣的物體可能有相同的物理屬性,相同的物體也可能有不一樣的物理屬性。因此使用低等級的語義特徵進行圖像分類極可能是不正確的。
可是,將高級語義特徵(即人類操做員根據用途和其餘信息賦予對象的各類屬性)引入圖像分類中,可能會以較高的準確性進行更明確的分類。例如,有一系列包含不一樣場景的HSR圖像,能夠基於低級特徵描述來識別土地覆蓋物對象,例如 建築物。 可是,嘗試捕獲高級潛在語義概念的目的是尋求不一樣的功能類型,例如住宅區,商業區和工業區。
④HSR場景分類
爲了彌合LULC之間的「語義鴻溝」,最近的研究已將「場景分類」的概念引入到HSR圖像分類中,以用單個類別標記場景。當前的大多數研究都應用了詞袋(BoW)建模方法,並經過機率主題模型(PTM)融合了地面場景的物理特徵,以提升具備高級語義信息的城市土地利用類型的檢測準確性。
Zhang et al.(2015b)引入了線性Dirichlet混合模型(LDMM),該策略融合了HSR圖像和道路網絡數據,以檢測每一個土地塊中土地使用的百分比
HSR提取特徵的侷限性
可是,從遙感圖像中提取特徵只能表明地面成分的外部天然物理特性,而區域土地利用類型一般與室內人類社會經濟活動具備很強的相關性,而這很難從HSR圖像中提取。
⑤社交媒體數據可反映室內人類經濟活動
爲了解決這個問題,最近的研究提出了「社會感知」和「城市計算」的概念。引入了多源社交媒體數據,例如浮動汽車的全球定位系統(GPS)軌跡,移動電話信號,社交媒體的簽到數據和興趣點(POI),以監視住宅活動和城市土地使用動態 。 許多深刻的討論代表,多源社交媒體數據具備揭示城市土地利用模式的巨大潛力。
Yuan等。 (2012年)提出了一個基於POI的語義分析模型DRoF來繪製城市功能區(Yuan等,2012)。 Yuan和Zheng(2015)引入了潛在狄利克雷分配(LDA)模型,該模型結合了浮動汽車的GPS軌跡和POI頻率來挖掘具備高級語義信息的城市土地利用類型,這能夠改善基於HSR圖像的方法
⑥上述兩種方法各自的侷限性及本文提出的方法
可是,這些方法僅利用一種類型的數據,而不是將HSR圖像和社交媒體數據中的地理空間信息融合到土地利用類型的檢測中。
城市土地利用類型類似的地區每每具備類似的外部天然-物理特性和室內人類社會經濟活動模式(Yao等人,2016),例如,僅僅利用遙感圖像信息而不使用室內人類活動信息很難將中央商務區(CBD)和帶有高層塔樓的住宅區區分開。另外一方面,都是人類活動較少的地區,光禿禿的田野和農田,能夠經過從遙感圖像中識別天然物理特性來區分。
如前所述,咱們的研究旨在經過結合幾種機器學習和天然語言處理(NLP)模型來融合從HSR圖像(遙感信息)和多源社交媒體數據(社會感知信息)做爲對城市土地利用進行分類並經過人工解釋評估分類模型的準確性和可靠性的模式。該模型用於檢測廣州市海珠區的土地利用方式,廣州海珠區是中國南方最發達的城市之一,具備多種土地利用類型。經過組合各類特徵並比較相應的分類結果,咱們獲得了特徵與土地利用分類結果的最佳組合。
2、研究區域和數據
①海珠區基本狀況
研究區域位於廣東省廣州市海珠區(圖1(a)),總面積102平方千米,常住人口約1,010,500。 廣州被認爲是華南地區的政治,文化和經濟中心。 做爲廣州四個市中心區之一,海珠區的城市結構很是複雜,混合了多種土地利用類型,例如住宅社區,購物中心,醫療設施和教育建築。
②對圖1(a)(b)進行解釋說明
圖1(b)顯示了2014年海珠區的高空間分辨率(HSR)Worldview-2圖像,其網格尺寸爲34,263×14,382,空間分辨率爲0.5 m。 根據OpenStreetMap提供的路網數據,HSR圖像和官方城市規劃數據,咱們將圖像分爲593個土地斑塊,相似於交通分析區(TAZ)(Long and Thill 2015)。
圖1(a)經過人工解釋顯示了研究區域中主要土地利用類型的分類結果,其中包括公共管理服務用地(M),工業用地(I),綠地(G),商業用地(C) ,住宅用地(R),公園用地(P)和城市村莊(U)。
表1. 案例研究區域:廣東省廣州市海珠區。 (a)在交通分析區一級的單位內經過人工解釋得到的城市土地使用數據; (b)Worldview-2衛星在研究區域內提供的高空間分辨率(HSR)遙感圖像; 前面的黑線表明從OpenStreetMap(OSM)下載的道路; (c)高德興趣點(POI)的空間分佈密度。
③多源社交媒體數據
社交媒體數據包括OpenStreetMap(OSM)道路網絡(http://www.open streepmap.org),高德POI和實時騰訊用戶密度(RTUD)(http://heat.qq.com),用於補充HSR圖像提取的特徵,並豐富用於研究區域土地用途識別的其餘信息。
咱們研究中的POI由高德地圖服務(http://lbs.amap.com/)提供,高德地圖服務是中國最受歡迎和最大的網絡地圖服務提供商之一。 咱們經過高德地圖API(圖1(c))從研究區域中的432個類別的大約123,915條記錄中得到了POI(包括企業,商業場所,教育設施(幼兒園,小學和中學),居住社區,臨牀) 設施和風景名勝區。
RTUD是適用於t語義分類的新數據集,其中包含使用騰訊應用程序(例如,騰訊移動應用QQ(相似於Messenger的軟件),微信(移動聊天軟件),Soso Maps( Web地圖服務和導航軟件)以及其餘提供LBS服務的移動應用程序。圖2經過在25 m的空間分辨率下分別計算工做日和休息日數據的平均值來顯示RTUD時間序列數據。
先前的研究代表,均值過濾是一種有效的社交媒體數據預處理方法,能夠減小數據大小和計算需求,而不會形成太多信息丟失。
表2. 研究區域中實時騰訊用戶密度(RTUD)的時間序列數據集。 (a)工做日9:00,(b)工做日17:00和(c)工做日22:00,(d)休息日9:00,(e)休息日17:00和(f)休息日22:00
3.方法
圖3.經過語義模型融合多源地理空間數據(包括HSR圖像和多源社交媒體數據)而提出的城市土地利用分類模型的流程圖。
①研究方法總述(4步)
該模型的流程圖如圖3所示。咱們的研究目的是經過融合HSR遙感圖像和社交媒體數據中的多源特徵,對主要的城市土地利用類型進行分類。在這項研究中,咱們採用瞭如下四個步驟來肯定每一個交通分析區域(TAZ)中的城市土地利用類型。
首先,咱們使用窗口掃描從遙感圖像中提取特徵。 提取的特徵經過光譜,紋理和空間包絡特徵進行表徵,並同時使用尺度不變特徵變換(SIFT)提取旋轉不變特徵。
其次,咱們使用k-means聚類方法將上一步中提取的特徵和RTUD數據分爲幾類,並主觀定義POI的類型。 咱們得到了大量視覺單詞,這些單詞經過k-means算法進行聚類並被視爲中級特徵,以便將它們與低級原始特徵和高級語義詞彙特徵區分開來,並構建了多源詞典 BoW。
第三,咱們基於開源的OSM道路網絡數據在研究區域中描繪了TAZ,並計算了從每一個TAZ中的HSR圖像和社交媒體數據中提取的特徵詞。 經過使用PTM,咱們將基於特徵詞出現頻率的潛在語義特徵挖掘到高維語義向量中。
最後,咱們應用了多類支持向量機(SVM)模型。 咱們使用在地面上驗證的選定土地使用數據來訓練SVM模型,以對城市土地使用類型進行分類,並評估語義特徵不一樣組合下的分類性能。
②環境支持
咱們的研究團隊在Windows 8.1(×64)上使用C ++實現瞭如下所述的模型,包括CGAL(http://www.cgal.org),GDAL(http:// www.gdal.org/)、OpenCV(http://opencv.org/)和 LIBSVM(http://www.csie.ntu.edu.tw/~cjlin/libsvm/)。 基於LDA的主題模型的源代碼可從普林斯頓大學(http://www.cs.princeton.edu/~blei/topicmo deling.html)得到。
3.1 空間特徵提取
①HSR圖像信息及利用
HSR圖像包含豐富的光譜和空間信息。 在全部特徵描述符中,HSR圖像的光譜和紋理特徵可以反映出地面成分的內部成分和色調變化。 SIFT特徵描述符能夠處理地面組件的模式識別的拉伸,旋轉和視角變化,這已在圖像分析中獲得普遍應用。 本文從HSR圖像中提取的模式相似於Zhong等人基於語義分配級別(SAL)的PTM模型中的模式。
②光譜特徵的表示
爲了下降從HSR圖像提取光譜特徵時的計算複雜性,咱們採用具備必定大小的窗口和間隙,併爲每一個HSR圖像提取每一個波段的均值和標準差(STD)。 所以,第i個窗口中心的光譜特徵 能夠表示爲其中B表示頻段計數。 咱們能夠繼續一些均勻間隔的光譜特徵向量。
③紋理特徵的表示
灰度共生矩陣(GLCM)有效描述圖像和紋理的圖案。 與光譜特徵類似,咱們將圖像的灰度級壓縮爲八幅圖像,並提取四個基於GLCM的Haralick特徵統計量,包括每一個窗口中具備必定大小的相關性,ASM,能量,對比度和同質性。設B爲帶寬,第i個窗口的紋理特徵爲:
④SIFT(尺度不變特徵變換)描述圖像局部特徵
在這項研究中,咱們介紹了兩種方法(SIFT和GIST)來描述圖像的局部特徵。
第一種方法是在每一個窗口中計算SIFT功能。 先前的研究代表,當採用128維矢量表示SIFT特徵時,它能夠實現最佳的優化配準性能。爲了下降計算成本,咱們得到了HSR圖像的第一部分,而後採用窗口掃描的方法來提取SIFT特徵向量,其中第i個窗口中心的SIFT特徵爲
在描述整個場景時,咱們一般使用部分模式而不是全局模式。因爲HSR圖像的複雜性和不肯定性,該方法不只計算和存儲成本高,並且在兩個場景相同但具備不一樣的內部地面份量空間分佈的狀況下也會致使誤分類。爲了解決這個問題,咱們引入了奧利維亞等人提出的GIST空間包絡特徵,其在宏觀層面上描述圖像場景的有效性已在最近的研究中獲得證明。
⑤GIST(空間包絡)描述圖像局部特徵
SIFT描述符最初旨在識別在不一樣條件下出現的同一對象,而且具備很強的區分能力。 「 GIST」是場景的抽象表示,能夠自發激活場景類別的內存表示,而且在識別天然場景類別例如 山和海岸。 GIST被認爲是一種常見的空間包絡特徵描述符,能夠充分描述五個不一樣的空間包絡場景,包括天然度,開放度,粗糙度,膨脹度和堅固性。 在咱們的研究中,咱們將每一個窗口劃分爲4x4,並計算每一個波段的GIST特徵。 與SIFT類似,第i個窗口的主要GIST特徵是:其中,B表明帶寬。
⑥社交媒體數據
轉折句:
儘管遙感數據能夠充分表明地面組成部分的物理屬性,但不能說明人類活動形成的社會經濟屬性。
社交媒體數據能夠補充有關人類活動的信息。 先前的研究代表,POI的分佈能夠有效地用於說明地塊的功能。在這裏,咱們將POI類別介紹爲一種反映社會經濟屬性的虛擬詞語類型。 而後能夠經過過濾的RTUD時間序列得到人類活動的模式,其時間和值很重要。 城市居民活動的特色與周圍環境和城市功能區密切相關。 所以,RTUD的時間序列能夠表示某些區域的功能模式。 所以,咱們將每一個窗口的RTUD模式描述爲,j表示研究區域內的第j個窗口,w和r分別表明工做日和休息日的時序曲線。
3.2 創建多源BoW詞典
①定義向量
假設某城市存在某個區域R,其多源特徵能夠描述爲,其中i,j和k分別指示R區域中RTUD數據的窗口中心,POI和柵格中心。 請注意,是一個多維向量。 咱們使用k-means方法對BoW詞典中的每一個特徵進行聚類並將其轉換爲某個虛擬詞。 所以,區域R中的特徵詞能夠描述爲一個文檔,其中wordPOI是內部POI類別的集合,在此基礎上,咱們能夠應用主題模型來識別和分類多源文檔。
②創建過程
須要在較大的研究區域中提取大量的特徵數據,這會致使在聚類過程當中效率低下。 當特徵數量超過500,000時,咱們選擇了500,000個數據點的隨機子集,經過k均值聚類進行初步聚類,並經過輪廓估計進行迭代以優化結果。 基於經過初步聚類過程得到的聚類中心,計算出歐幾里得距離,以估計每一箇中心與其餘未標記語義特徵向量之間的類似性; 未標記的特徵被分類爲最接近的特徵。
3.3 經過PTMs和SVM進行語義分類
圖4:(a)pLSA和(b)LDA的機率圖形模型。 節點W,Z,D分別表示虛擬詞,主題和文檔(或圖像),而α表示節點的Dirichlet分配
LDA模型中的主題。
如圖4所示,PTMs(包括機率潛在語義分析(pLSA)和LDA模型)旨在評估生成的虛擬單詞和挖掘文檔的潛在語義特徵。 PTMs已被普遍應用於NLP領域。 並且,近年來在HSR圖像的場景分類中取得了使人滿意的結果。
①LDA解pLSA的過擬合問題
pLSA利用文檔,主題和單詞之間的關係,分解單詞wj的機率,這出如今BoW與機率和總機率公式結合的論文中。
在等式(1)中,展現了潛在語義空間中的基本向量,而表明主題分佈,能夠將其視爲給定文檔的語義特徵。 所以,咱們將向量集應用於表示文檔。
pLSA模型存在過擬合的問題,由於它表示的每一個文檔只是某個主題離散機率的數字形式。 它沒法在訓練數據集以外挖掘語義特徵。 爲了解決這些問題,新的基於LDA的pLSA模型假設語義困惑參數受Dirichlet分配的約束。對於具備K個給定主題的某些文檔,向量組中的每一個向量都遵循帶有參數的Dirichlet分配。 LDA定義原始潛在語義分佈的機率函數是解決pLSA缺點的關鍵。
②PTMs和SVM進行語義分類的過程
基於OSM道路網絡數據,咱們將研究區域劃分爲幾個TAZ。 將每一個TAZ視爲一個地塊,咱們計算了全部要素類中視覺單詞的分佈頻率,並將結果輸入到PTMs模型中,以計算高維潛在語義特徵。
而後,將在先前的研究中已被證實在對高維特徵進行分類方面具備很高的效率的SVM應用於咱們提出的模型中,以識別TAZ中的城市土地利用類型。 因爲SVM是二進制分類器,所以咱們採用多分類器組合的方法來訓練和分類每一個TAZ中的潛在語義特徵。
最終分類結果由每一個TAZ中最常出現的類別給出。
③本研究的訓練過程
在這項研究中,咱們在每一個類別中選擇50%的訓練樣本,這些樣本的特徵被隨機組合並輸入到多類別SVM分類器中。 其他50%的數據用做測試數據。 SVM分類器由LIBSVM軟件包實現。
在訓練過程當中,咱們使用訓練數據集的25%做爲驗證數據集,並使用Kappa評估模型校準。 須要調整帶有徑向基函數(RBF)內核的SVM的兩個敏感參數,懲罰C因子和內核參數NU。 咱們設置並經過網格搜索方法搜索最佳參數,其中優化目標是最大化Kappa。
4.結果
4.1 經過不一樣的特徵組合來進行場景分類
表2:經過語義特徵進行不一樣組合的場景分類結果
圖5:經過語義特徵的不一樣組合得出的基於LDA的土地利用分類結果。(a)光譜,紋理和SIFT,(b)光譜,紋理,SIFT和GIST,(c)POI,(d)RTUD,(e)POI和RTUD,以及(f)光譜,紋理,SIFT,GIST ,POI和RTUD。
圖6:經過pLSA的場景分類結果混淆矩陣。 功能組合:(a)光譜,紋理和SIFT,(b)光譜,紋理和SIFT。 GIST,(c)POI,(d)RTUD,(e)POI和RTUD,以及(f)光譜,紋理,SIFT,GIST,POI和RTUD。
表2顯示了不一樣的特徵組合方法及其平均精度,圖6顯示了每種組合的分類結果(圖5)中最接近平均準確度的混淆矩陣。 爲了確保分類結果的可靠性和穩定性,咱們對每組重複進行了100次分類過程,並計算了平均分類準確性。
①LDA模型和pLSA模型對比並分析其緣由
如表2和圖5所示,HSR圖像或社交媒體數據中基於PTM的語義特徵可用於區分地塊的功能類型。 關於SVM分類的準確性,LDA模型生成的語義特徵比pLSA模型生成的語義特徵稍高。 現有研究代表,在測量預測新文檔的複雜性時,LDA比pLSA更好。
咱們的研究區域位於廣州市區,高度混合的土地利用斑塊做爲天然保護區中的主題混合文檔,這將使LDA模型產生更好的分類結果。所以,這項研究採用了額外的二進制除法程序來優化LDA模型的敏感超參數α,相關參數對分類結果的準確性的影響將在如下部分討論。
② 從結果分析僅使用HSR圖像進行研究的侷限性
傳統的基於HSR圖像的場景分類方法僅考慮光譜,紋理和SIFT特徵,只能在複雜的城市土地利用分類中得到較差的分類精度。將GIST特徵用於宏觀描述場景並不能提升分類的準確性,由於使用從遙感影像中提取的天然-物理語義特徵對區分高度混合的土地利用斑塊具備挑戰性。
如圖6(a,b),7(a,b)和表3所示,僅應用紋理特徵時,商業用地(圖5(a,b)中的#1和#5)很容易與住宅混合 土地,工業用地和城市村莊,由於商業用地一般普遍分佈在遙感影像中,並表現出複雜的空間格局。所以,從遙感圖像中提取的天然物理特徵不能反映城市功能區的內部特性和結構。
圖7.經過LDA的場景分類結果混淆矩陣。 功能組合:(a)光譜,紋理和SIFT,(b)光譜,紋理,SIFT和GIST,(c)POI,(d)RTUD,(e)POI和RTUD,以及(f)光譜,紋理, SIFT,GIST,POI和RTUD。
③社交媒體數據對結果的影響
圖6(c,d),7(c,d)顯示了從社交媒體數據(如POI和RTUD)中提取的語義特徵,它們是城市土地利用類型與人類活動(包括商業用地和居住用地)的高度相關性。 這兩種數據的分類準確性明顯提升; 總準確度和Kappa分別提升9.95%和16.58%。
與POI相比,RTUD能夠有效地區分居住區和城市村莊,這能夠說明時間序列人口密度更可以反映城市區域內地面真實土地用途的類型。 基於POI的語義特徵比RTUD更好地區分了城市村莊,這說明POI的分佈與人們的室內習慣相比在城市村莊識別中具備更大的優點。
如圖5(c,d)所示,能夠經過基於RTUD的語義特徵來充分識別人類活動稀少的城市區域,例如綠地和公園地。 所以,將POI和基於RTUD的語義特徵組合在一塊兒進行分類。 與每種類型的特徵(C組和D組)的獨立應用相比,該模型得到了更好的結果,後者的整體準確度(OA)和Kappa分別增長了0.03-0.05和0.04-0.05。
④當同時使用HSR圖像和社交媒體數據時獲得的效果最好
在特徵組合測試的F組中,咱們將全部語義特徵輸入SVM以對土地利用類型進行分類,並得到最佳的分類結果,其中OA和Kappa超過0.80。 從實驗結果中,咱們發現能夠區分人類活動稀疏的區域(例如綠地和公園用地)和土地使用類型複雜的區域(例如商業用地和居住用地)。例如, 當只考慮基於遙感或基於社交媒體的語義特徵時,如圖5#2所示,當僅將公共管理服務用地劃分爲公園用地(圖5(b)#2)和住宅用地(圖5(e)#2)時,分類不正確。
可是,經過融合兩個建議的主要特徵能夠正確地識別地塊(圖5(f)#2)。 經過在建議的模型中將每一個HSR區中的HSR圖像的天然-物理特性和社交媒體數據的社會經濟特性融合在一塊兒,能夠得到最佳的分類結果。
表3:經過語義特徵的不一樣特徵組合,每種土地利用類型的場景分類精度
4.2 參數敏感性分析
在本節中,咱們評估分類精度與咱們提出的模型的三個關鍵參數之間的相關性,其中包括樣本窗口的大小,構成BoW的聚類類別的數量以及PTM中使用的主題數量。 在先前的研究中已經充分討論了用於提取HSR圖像中地面成分的天然物理特性的樣本窗口的大小因子。 根據Zhong(2015)的結論,咱們將HSR圖像分割爲25x25個像素的一組重疊圖像塊,以肯定光譜,紋理,SIFT和GIST特徵。 每對相鄰的補丁設置爲重疊15個像素,以保留足夠的空間信息。
圖8:將PTM的主題數設置爲100,將LDA的Dirichlet主題分配參數α設置爲0.8,使用不一樣的k均值聚類數(x軸)對場景分類結果進行準確性評估(y軸)。 (a)pLSA和(b)LDA。
圖9:將k均值的聚類數設置爲500,將LDA的Dirichlet主題分配參數α設置爲0.8時,使用不一樣的PTM初始主題數(x軸)對場景分類結果進行準確性評估(y軸)。 (a)pLSA和(b)LDA。
圖10.PTM的主題數設置爲100,k均值的聚類數設置爲100時,使用LDA的不一樣Dirichlet主題分配參數α(x軸)進行場景分類結果的準確性評估(y軸)。
① 結合圖分析各個參數敏感性
先前的幾項研究代表,視覺單詞的數量和初始主題對基於PTM的場景分類的分類準確性有重大影響。 可是,得到最佳主題的方法仍然是一個未解決的問題。
圖8和圖9顯示了k均值簇數,PTM主題數和分類準確性之間的關係。pLSA和LDA模型都可以在某個窗口區域內得到相對較好的性能。 圖8證實了k均值聚類數量的減小會致使基於PTM的場景分類的分類結果的準確性穩定而且幾乎沒有波動。
所以,在固定K值的狀況下,pLSA和LDA的準確性水平表現出最初的明顯誤差,並最終致使初始主題數量的增長(圖9)。 因爲Dirichlet主題分配參數α的最佳結果不肯定,所以基於LDA的場景分類結果的準確性表現出很大的波動性(圖10)
在多源空間數據融合場景分類領域,獲取最佳初始主題數和α的方法還沒有解決。 經過以上對模型參數的敏感性分析,咱們分別選擇了k均值的聚類數和PTM的初始主題數,分別爲500和240。
5. 討論
在有關HSR遙感和社交媒體數據分析的最新文獻中,提升城市LULC分類準確度一直是一個重要問題。 可是,不多有研究有效地融合了從多源地理空間數據中提取的語義上的各類特徵。 這項研究提出了一種有效的框架,經過融合從HSR圖像和社交媒體數據(如高德興趣點(POI)和RTUD)提取的語義特徵,對城市土地利用進行分類。
①對本研究結果的討論
這項研究結合了從PTM得到的幾種不一樣的語義特徵,並將其輸入到SVM分類器中。 結果代表,HSR圖像和社交媒體數據都可對城市土地利用類型進行高精度分類。
咱們的發現與之前的研究一致,即HSR圖像有利於識別農村地區的天然成分,而社交媒體數據的使用對於人口密度高的大都市區更好。將全部功能組合到SVM分類器中後,結果得到了最高的準確性(OA = 0.865,Kappa = 0.828),這代表咱們的模型能夠有效地融合HSR圖像和社交媒體數據中的天然-物理和社會經濟信息,從而得到更高分辨率的 城市土地利用分類。
②將來可進行的研究(數據方面)
一方面,在將來的研究中,咱們指望引入更多開放的社交媒體資源(例如移動數據和浮動汽車軌跡); 另外一方面,基於全球敏感性分析(GSA),將評估來自不一樣數據源的數據對不一樣類型土地利用類型進行分類的適用性。 此外,咱們使用了大量的遙感圖像樣本和多種類型的開放式社交媒體數據來構建訓練數據集,並對不一樣類別和準確性進行敏感性分析。 這項工做將幫助咱們創建一個框架,以瞭解不一樣級別的城市土地使用模式。
③更細粒度的土地利用方式來替代TAZ
在許多涉及城市土地用途劃分,場景分類和城市功能區分類的研究中,TAZ被用做基本單位,而在中國大城市的城市研究並不罕見。 他們的結果代表,使用TAZ來識別城市土地利用模式是合理和有效的。 可是,實際上確實存在城市地區的混合土地使用,甚至單個建築物都具備不一樣的功能。 面對這個問題,多源地理空間數據,包括社交媒體數據和HSR圖像,可能會提供一種新工具來量化土地使用的混合性,並在將來區分實際的土地使用狀況和城市規劃。 所以,在將來的研究中,應該肯定更細粒度的土地利用方式來替代TAZ。
④土地混合使用問題
這項研究的目的是在語義模型的框架內探索多源空間數據的整合,從而有效地分析每一個研究單位(TAZ)的主要土地利用類型。 可是,城市土地使用方式複雜多樣,尤爲是在中國的特大城市中。 例如,在咱們的研究區域中,許多多功能土地用途與生活和商業功能混合在一塊兒,這增長了經過人工解釋或培訓樣本選擇來識別土地用途的難度。 儘管咱們已經對土地用途進行了硬分類,但已經得到了較高的準確性,但結果是基於對數據的準確和人工解釋。 所以,在將來的工做中,應基於開放的社交媒體數據在將來的研究中考慮土地混合使用的問題。
6. 結論
研究課題的意義:
快速的城市發展致使城市內土地利用類型的多樣化和複雜化。 因爲城市規劃者和政府決策者必須考慮到土地利用的現狀,所以及時而充分的城市土地利用信息無疑將促進城市的可持續發展。 可是,城市土地利用方式的複雜性和融合性給準確有效地繪製城市土地利用繪圖帶來了巨大挑戰。
本研究的框架步驟:
一個框架:經過融合從HSR遙感影像和多源社交媒體數據中提取的多源語義特徵,在TAZ單位級別對主要城市土地利用類型進行分類。 首先,咱們從HSR圖像和開放的社交媒體數據(包括POI和RTUD)中提取了各類特徵,並創建了基於k均值的BoW和全部特徵類別的字典。 在第二步中,引入了包含pLSA和LDA的PTM以提取多源語義信息。 最後,咱們將不一樣類型的語義特徵融合並輸入到廣州海珠區的多類SVM分類器中。
結果:
結果代表,該模型能夠有效地融合從HSR圖像和多源社交媒體數據中提取的天然,物理和社會經濟語義特徵,以得到最高的城市土地利用分類精度(OA = 0.865,Kappa = 0.828)。
將來工做:
咱們可能會繼續從如下三個方面來研究融合模型:首先,發現各類開放式社交媒體數據在檢測城市土地利用方面的潛力; 其次,利用該模型提升了城市土地利用融合模式檢測的準確性。 最後,討論應用從城市土地利用圖提取的空間信息進行深度學習的可行性。