資源整理。php
1.地理空間應用的Docker鏡像,安裝有GDAL等經常使用開源空間分析庫。python
2.R語言包clex,氣象數據提取與降尺度。github
clexweb
3.用R作數據科學和數據分析的書。正則表達式
4.R語言包leafsync,leafsync是一個插件,用於生成包裝Leaflet.Sync的可能同步的小型多頁Web地圖。docker
leafsync數據庫
5.R語言包twoe,估算樹種數量統計學和模擬森林動態。編程
6.R語言包betterposter,使用R Markdown和pagedown更好看的科學壁報。
7.一塊兒來學技術。自學者的福音網站。
8.R語言dabestr,Bootstrap耦合估計的數據分析包。
9.面向開發人員的機器學習基礎框架。
10.Python庫automl_gs,提供輸入CSV和目標字段進行預測,生成模型+代碼以運行它。
11.auto-sklearn是一個自動化的機器學習工具包,是scikit-learn估算器的直接替代品。
12.Featuretools是一個用於自動化特徵工程的python庫。
13.python-pdal的conda-smithy存儲庫。pdal是點雲數據處理的GDAL衍生庫。
14.R語言包h3js,R中h3-js的接口,一個基於六邊形的地理網格系統。
15.R語言包batchtools,做爲BatchJobs和BatchExperiments軟件包的後續產品,batchtools爲由Slurm,Sun Grid Engine,OpenLava,TORQUE / OpenPBS,Load Sharing Facility(LSF)或Docker Swarm等調度程序管理的高性能計算系統提供Map的並行實現。
16.Geoportal Server下一代搜索應用程序和元數據目錄,基於elasticsearch。
17.Geoportal Server是一種基於標準的開源產品,能夠發現和使用地理空間資源,包括數據和服務。
18.R語言包validate,驗證R-package能夠很是輕鬆地檢查數據是否符合您對領域知識的指望。 它的工做原理是容許您定義獨立於代碼或數據集的數據驗證規則。 接下來,您可使用規則來對抗數據集或其各類版本。 結果能夠彙總,繪圖等。
19.ripgrep是一種面向行的搜索工具,能夠遞歸搜索當前目錄中的正則表達式模式。 默認狀況下,ripgrep將尊重您的.gitignore並自動跳過隱藏的文件/目錄和二進制文件。 ripgrep在Windows,macOS和Linux上擁有一流的支持,每一個版本都有二進制下載。 ripgrep相似於其餘流行的搜索工具,如The Silver Searcher,ack和grep。
20.SQL Server,Oracle,MySQL,PostgreSQL,SQLite,DB2的示例數據庫。
21.TVM是深度學習系統的編譯器堆棧。 它旨在縮小以生產力爲重點的深度學習框架與以性能和效率爲重點的硬件後端之間的差距。
22.使用條件對抗網的PyTorch實現圖像到圖像的翻譯(pix2pix)。
23."Learning to Discover Cross-Domain Relations with Generative Adversarial Networks."的Pytorch實現。
24.graphpipe-go提供了多種功能,可幫助您使用很是快速的GraphPipe協議輕鬆提供和訪問ml模型。
25.ONNX Runtime:跨平臺,高性能評分的ML模型引擎。
26.Web性能的方方面面。
27.R語言包broman,包含Karl Broman我的R代碼的軟件包。
28.R語言包Cubist,用於擬合Quinlan Cubist迴歸模型的R包。
29.R語言包HighFreq,目的是建立一個功能庫,用於管理交易和報價(TAQ)和OHLC數據,以及從該數據中有效地估計各類統計數據,如波動率,誤差,赫斯特指數和夏普比率。
30.交互式的Brokers Trader Workstation的R接口。
31.oist是一種將矩陣或數組輸出到無損圖像文件的快速方法。
32.一本在大學水平上寫的開源教科書。 OpenIntro還提供第二個大學水平的入門統計教科書和高中變體。
33.用R實現17種分類算法。
34.在R中使用CPU性能數據的19個迴歸模型。
35.R語言包dfdetective,搜索數據框,不要觸及任何行。
36.合成孔徑雷達(SAR)軟件,庫和資源的精選列表。
37.Python HDR圖像處理庫。
38.RAT(雷達工具)是一款功能強大的開源軟件工具,用於處理IDL編程的SAR(合成孔徑雷達)遙感數據。 它已在柏林科技大學開發多年,現已停產! 此存儲庫包含最新版本的RAT,它收到了一堆錯誤修正,使其能夠與當前的IDL版本一塊兒使用。
39.李宏毅機器學習(臺灣大學)。
40.Datawhale 學習社羣問題庫。
41.用於重現「百頁機器學習手冊」中插圖的Python代碼。
42.用於預覽LaTeX PDF輸出的Vim插件。
43.使用gluon-cv重現SFD面部檢測器。
44.R語言包vroom,快速讀取分隔文件。
45.Google Earth Engine分析是否可重現?
46.R語言包knitrBootstrap,一個框架,用於從knitr Rmarkdown建立bootstrap樣式的HTML報告。
47.瓦赫寧根大學地理處理腳本,課程13:Google Earth Engine。
48.R語言包Sinew,它生成一個roxygen2骨架,其中填充了從函數腳本中刪除的信息。
49.R語言包moderndive,用於tidyverse友好的介紹性線性迴歸。
50.從計算生物學到金融建模,R計算環境已成爲定量研究的重要工具。在本次實踐研討會中,咱們將探討經常使用的策略,以有效地分析R中的大規模數據集。參與者將學習如何在計算集羣上自動化他們的R分析,配置文件內存使用,在R中調用快速C ++例程,並實現簡單的並行化策略,包括多線程和分佈式計算。
51.R語言包RcppXsimd,R C++包裝器,用於C ++標頭庫Xsimd,它使用SIMD提供並行化數學實現。
52.大規模縱向證據系統中健康信息的自動錶徵(ACHILLES) - 關於OMOP CDM數據庫的描述性統計。
53.R語言包SqlRender,這是一個R包和Java庫,用於呈現參數化SQL。
54.用於在OMOP公共數據模型中的觀察數據庫中執行患者水平預測的R包。
55.Keras 深度學習庫 PDF 版。
56.用於空間遺傳分析的腳本和文件。
57.深度學習研究人員的天然語言處理教程。
58.一組簡單的bash命令,它們將r-spatial工具帶到Linux命令行。
59.Python庫GOSTnets,它聚集了一系列函數,用於使用開源數據對位置之間的物理鏈接進行快速,獨立的分析。
60.使用R的Shiny庫構建的地圖,用於顯示美國城市中的無人設備。
爲解決中國嚴重的細顆粒物(PM 2.5)污染問題,政府自2005年以來一直實施嚴格的控制政策,主要針對發電廠,工業和交通運輸,但政策的有效性和健康影響的時間趨勢的估計是大的不肯定性。經過結合化學傳輸模擬,環境/家庭暴露評估和健康影響評估的綜合方法,咱們發現PM 2.5(IPWE)的綜合人口加權暴露降低了47%(95%置信區間,37- 55%)從2005年[180(146-219)μg/m³]到2015 [96(83-111)μg/m³]。出乎意料的是,這種減小的90%(86-93%)歸因於家庭固體燃料使用的減小,這主要是因爲快速城市化和收入改善而不是具體的控制政策。因爲用於烹飪和加熱的家用燃料的IPWE減小,但烹飪的影響明顯更大。家庭相關的IPWE減小估計每一年能夠避免0.40(0.25-0.57)百萬的過早死亡,佔2015年PM 2.5誘導的死亡率的33%.IPWE將進一步減小63%(57-68%)若是剩餘的家用固體燃料被清潔燃料取代,這將避免額外的0.51(0.40-0.64)百萬的過早死亡。這種向清潔燃料,特別是供暖的過渡,須要技術創新和政策支持,以克服分配系統成本高的障礙,正如最近在京津冀地區嘗試的那樣。考慮到家庭燃料使用對PM 2.5暴露的影響,咱們建議家庭燃料的使用在國家控制政策中的優先級更高。發表於PNAS的一篇雄文,分析了家庭燃料變化對PM2.5暴露和過早死亡率的影響。分析結果發現家庭燃料纔是PM2.5暴露和過早死亡率降低的主要緣由。這一點仍是比較有意思的,以前北大陶澍院士團隊也作了相關的工做,深刻農村收集燃料庫構建排放清單。
2.Urban green space cooling effect in cities/城市綠地降溫對城市的影響
城市綠地被認爲是減小城市熱島效應併爲附近居住者提供溫馨的適當方式。除了冷卻實際空間外,城市綠地也可以影響周邊地區,這種現象被稱爲城市綠地降溫效應。關於城市綠地降溫效果的最重要問題是冷卻的強度和密度,這對城市設計師和規劃者在處理城市熱島方面起着重要做用。本文回顧了近年來研究城市綠地降溫效應的最新研究。根據他們的樣本評估方法,研究分爲三組。第一類包括對整個城市的一部分或整個城市的一組城市綠地進行研究,主要經過遙感和衛星地圖進行。第二類調查城市公園或幾個具備可識別形狀和位置的城市公園。在本節中,主要經過實地觀察收集信息。第三類涉及根據不一樣的綠地佈局情景經過模擬對城市空間的一部分進行建模的研究。本研究結果代表,最大的冷卻效果距離和冷卻效果強度適用於面積超過10公頃的大型城市公園;然而,除了該地區,城市綠地的天然元素和質量,以及氣候特徵,影響城市綠地降溫效果。分析了城市綠地的降溫效應。分析了降溫效應的距離以及強度與公園的大小關係,此外城市綠地的基本要素對降溫效果有關鍵做用。
城市不透水面(UIS)影響城市系統的結構和功能,被普遍認爲是城市環境條件的關鍵指標。然而,統計研究的數量和模式都隨着空間尺度的變化而變化,這使得統計研究所的計算和解釋變得複雜。須要更好地理解UIS的空間尺度關係來解決這種困境。所以,本研究的主要目的是利用中國三大城市羣的數據,探討UIS如何隨着城市等級層面的空間範圍和人口規模的增長而變化。此外,對六個世界大都市區進行了比較分析,以測試UIS比例關係的通常性。使用尺度圖和標準化的主軸迴歸來研究關於空間範圍和城市尺寸的比例關係。咱們的主要研究結果包括:(1)當分析的空間範圍從當地城市擴展到整個城市羣時,UIS的總量增長,而UIS的百分比以階梯式降低; (2)UIS的空間尺度遵循當地城市中至關一致和嚴格的冪律功能,但在當地城市以外變得不那麼一致且不那麼緊張; (3)UIS總量的比例關係比UIS的比例更加一致,UIS的總量與城市面積的關係比城市人口規模更緊密。這些發現揭示了統計研究所的規模依賴性,代表應採用多尺度方法來量化統計研究所並將其用做城市環境指標。鄔建國老師團隊的成果,分析了城市不透水面的空間尺度效應。強調了多尺度研究的必要性。
到2050年,70%的人口可能生活在城市中,使城市化成爲一個日益增加的全球趨勢。檢測生態系統服務(ES)及其捆綁的變化以應對城市化對於評估土地使用政策相當重要。咱們研究了中國京津冀都市區2000年至2010年穀物,蔬菜,水果,碳固存,土壤保持,防沙,保水的變化狀況;而後,使用k-means聚類分析,咱們根據相似的ES集合將該區域的202個縣分爲組(捆綁)。咱們發現(1)城市,林地和草地分別增長了22%,3.6%和1.7%,而耕地減小了4.6%; (2)儘管農田全面減產,但糧食,蔬菜和水果的供應量增長了24-90%;碳儲存和保沙率分別增長了40%和7%,而土壤和水分保持率略有增長。每一個1%; (3)72個縣改變了他們的ES捆綁; 2000年「農業捆綁」占主導地位,2010年降低了50%,主要轉變爲「次發達城市羣」,代表這十年間農田流失。 ES捆綁的轉換可用於理解城市化的影響。該研究代表,農村地區的改良技術和生態恢復有助於在快速城市化的世界中維持多種ES。分析了十年間京津冀都市圈多元生態系統服務變化影響以及相互做用。
5.The Hidden Hazard of Household Air Pollution in Rural China/中國農村家庭空氣污染的隱患
中國城市的空氣污染已成爲公衆辯論和政治關注的主要議題。與此同時,不多有農村地區受到環境空氣質量的測量,政策文件和媒體不多討論使用生物質進行烹飪和取暖而產生的家庭空氣污染(HAP)形成的健康和環境風險。 2014年至2017年期間,一個跨學科團隊在中國最富裕的省份浙江省之一開展了空氣質量和空氣污染感的聯合研究。咱們發現農村的PM 2.5濃度與城市地區類似。此外,對於城市和農村參與者而言,24小時我的接觸微粒污染(PM 2.5)的平均值類似。然而,咱們發現某些亞組的暴露水平增長,如生物量使用者,女性和家庭廚師。咱們發現,雖然村民們很是關注來自附近工廠的空氣污染風險,但他們基本上沒有意識到HAP的問題。在本文中,咱們分析了HAP在所研究區域中對空氣污染暴露的貢獻程度,並討論了它在很大程度上仍然存在隱患的可能緣由。總之,咱們認爲農村地區的空氣污染應該獲得媒體,環保組織和政策制定者的更多關注;此外,特別是應將HAP歸入空氣污染政策的更大範圍內,並將其對農村地區空氣污染暴露的貢獻更加公開。這篇文章分析了農村空氣污染的隱患。相似前面介紹的文章,農村區域空氣污染其實也是一個很是重要的議題。
本研究的目的是評估年度和月度土地利用迴歸(LUR)模型在臺灣估算NO2和PM2.5空間分佈的表現。 2015年在73個空氣質量監測點收集樣本。數據轉換與提取原理組件和衛星衍生數據相結合,與LUR建模相結合,並應用於提升PM2.5模型性能。結果代表,與PM2.5相比,NO2表現出更強的模型性能。 NO2年度模型的留一交叉驗證(LOOCV)R²爲0.76,月模型的範圍爲0.56至0.81。經過應用主成分分析和增長衛星數據(即日照覆蓋百分比和睦溶膠光學深度),將PM2.5年度模化的LOOCVR²從0.13提升到0.56。這些方法還改善了PM2.5月度模型的性能。中位LOOCVR²從0.12增長到0.49。LUR的年和月尺度模型估算NO2和PM2.5的比較,總的來講NO2模型精度更高。
最近,研究人員引入了深度學習方法,如卷積神經網絡(CNN)來模擬時空數據,並取得了比傳統方法更好的結果。然而,這些基於CNN的模型使用網格圖來表示空間數據,這不適用於基於道路網絡的數據。爲了解決這個問題,咱們提出了一種用於基於道路網絡的數據建模(DSTR-RNet)的深度時空殘差神經網絡。所提出的模型構建局部鏈接的神經網絡層(LCNR)來模擬道路網絡拓撲而且集成殘差學習以模擬時空依賴性。咱們經過預測滴滴司機服務的交通流量來測試DSTR-RNet,該服務位於中國成都的一個8平方千米的區域,有2,616個路段。結果代表,DSTR-RNet保持了道路網絡的空間精度和拓撲結構,提升了預測精度。咱們討論預測偏差並將預測結果與基於網格的CNN模型進行比較。咱們還探討了模型對其參數的敏感性;這將有助於將此模型應用於基於網絡的數據建模。利用深度學習方法進行道路網絡建模,利用的是滴滴大數據。能夠說是衆包路網地圖數據的一個典型應用。這一方面武漢大學唐爐亮老師也有一些成果。
城市是複雜的系統;咱們指望城市化過程的動態遵循冪律,這暗示了異速生長的尺度效應。在過去的幾十年裏,城市規模做爲一種基礎理論引發了地理學和城市研究文獻的普遍關注;然而,它在全球範圍內的適用性存在不肯定性,特別是在中國等快速變化的城市環境中。更重要的是,關於中國城市異速生長規模的研究不多。本研究旨在展現動態演化概念在城市系統中的重要性。咱們研究了城市化的最重要影響是由尺度效應定律明確表現出來的,尺度指數是關鍵指標。咱們應用比例定律來檢驗假設,即與靜態或等距狀態相比,城市化的不一樣階段的實際比例指數是穩定的。咱們發現,中國政府主導的事態發展可能會破壞權力法律並擴大城市因素之間的關係,但這隻會在短期內發生。儘管不一樣城市的驅動力在不一樣的城市化階段改變了它們的影響;生長過程的指數(城市土地利用面積及其人口密度)遵照自類似性和尺度一致性的規律和規則。雙對數線性迴歸和分位數迴歸的分析揭示了城市系統的實際和觀察到的比例關係將始終演變爲與理論假設一致,這對將來城市發展和城市規模和城市密度的規劃提供了影響。分析異速生長的尺度效應是否與中國城市實際狀況相符?異速生長和尺度效應是一個很普遍的概念,值得深刻研究。
城市提供大量可能的就業和休閒機會。 在污染較嚴重的日子裏,這種消費城市休閒的收益可能會下降。 咱們研究了中國平常消費活動與室外空氣污染之間的關係,並找到了有利於這樣一個假設的證據,即清潔空氣和離開休閒旅行的家是補充。 鑑於發展中國家城市的空氣污染程度很高,監管致使的環境質量改善可能會進一步刺激對消費城市的需求。分析空氣對於城市人羣消費的影響。相似以前作的公共自行車騎行與天氣的相關關係,在污染天氣下,更多人會選擇呆在室內。城市活力降低,從而影響經濟和消費。