Coding and Paper Letter(六十六)

資源整理。node

1 Coding:

1.mars是一種基於張量的統一框架,用於大規模數據計算。python

marsgit

2.SVGD是一種通用的變分推理算法,它造成梯度降低的天然對應物以進行優化。 SVGD經過應用一種最小化KL散度的函數梯度降低形式,迭代地傳輸一組粒子以匹配目標分佈。該軟件包包含Matlab和Python語言的SVGD實現。 還提供演示以在咱們的論文中重現結果。 貝葉斯神經網絡示例基於Theano。github

Stein Variational Gradient Descentweb

3.非官方Python端口的puppeteer JavaScript(無頭)chrome/chromium瀏覽器自動化庫。puppeteer是谷歌瀏覽器自行開發的js庫。很是強大。正則表達式

pyppeteer算法

4.tf-explain將可解釋性方法實現爲Tensorflow 2.0回調,以簡化神經網絡的理解。請參閱tf-explain介紹spring

tf explainchrome

5.用於渲染bokeh Python可視化庫的Jupyter小部件。docker

ipybokeh

6.GDAL/OGR命令行的備忘錄。有不少GDAL/OGR命令行實現不一樣功能的demo。

gdal cheat sheet

7.geotiff.js是一個小型庫,用於解析TIFF文件以進行可視化或分析。 它是用純JavaScript編寫的,能夠在瀏覽器和node.js應用程序中使用。從各類不一樣(Geo)TIFF文件類型中讀取(地理空間)元數據和原始數組數據。

geotiff.js

8.此存儲庫包含一個docker容器——GDS環境。GDS環境也就是地理數據科學環境(Geographical Data Science Environment)。其中包括:完整的Python,可用於地理空間分析)。完整的R可用於地理空間分析。IRkernel和rpy2通道都經過Python與R交互。完整的LaTeX發行版。其餘開發實用程序(例如pandoc,git,decktape等)。它至關沉重(大約10GB),但它旨在提供一個徹底隔離的環境,能夠在各類環境中部署,並涵蓋幾種狀況。

gds env

9.Dockerfile用Jupyterhub和RStudio構建理想的多用戶數據科學服務器,爲Python,R和Julia語言作好準備。

math server docker

10.斯坦福數值分析公開課學習資料,內容豐富,介紹了數值分析常見的內容,涵蓋了機器學習中絕大多數優化方法,部分做業難度較大。

CS205A Mathematical Methods for Robotics Vision and Graphics

11.介紹mlr3的電子書,由bookdown生成,mlr意爲machine learning in R,這在網上已經造成一個良好的開源組織,有興趣的能夠關注。

mlr3book

12.R語言包geodistpar,geodist包的並行計算版本。

geodistpar

13.Terracotta是一個純Python 瓦片服務器,在專用網絡服務器上做爲WSGI應用程序運行,或做爲AWS Lambda上的無服務器應用程序運行。 它基於Python 3.6,由Flask,Zappa和Rasterio等開源軟件提供支持。

terracotta

14.該存儲庫包含用於「擬合線蟲羣體對時間和溫度的響應的線性和二次模型」的Rmd文件,該文件做爲02/2018的教學筆記發佈到開放植物病理學。

RC example website

15.圖分類方法的集合,包括嵌入,深度學習,圖形內核和分解論文以及參考實現。

awesome graph classification

16.在R Shiny app中插入ECharts可交互圖形

ECharts2Shiny

17.從無到有搭建一個以疾病爲中心的必定規模醫藥領域知識圖譜,並以該知識圖譜完成自動問答與分析服務。

QASystemOnMedicalKG

18.xarray的數據立方。

xcube

19.課程「EEwPython」是一系列Jupyter筆記本(colabs)用python學習Google Earth Engine(GEE)。 EEwPython分爲兩部分。 第一個是來自全部Google Earth Engine文檔的改編版,可以在python中運行,第二個是從新編譯不一樣的可重現示例。 若是您想參與EEwPython,請不要懷疑與咱們保持聯繫。

EEwPython

20.R語言包gratia,優雅的'基於ggplot'的圖形和實用功能,用於使用'mgcv'軟件包安裝的廣義可加模型(GAM)。 爲'mgcv'提供的GAM提供plot()方法的從新實現

gratia

21.具備交互式TLS功能的攔截HTTP代理,適用於滲透測試人員和軟件開發人員。

mitmproxy

22.使用斷軸建立matplotlib圖,brokenaxes使得matplotlib圖在軸上有斷點,用於顯示不連續範圍內的數據。

brokenaxes

23.mlr3的可視化。

mlr3viz

24.由波蘭統計局編寫的'bdl'軟件包是Local Data Bank(Bank Danych Lokalnych - bdl)API的一個接口,提供一系列有用的工具,如快速繪圖和使用數據庫中的數據生成地圖。

R Package to API BDL

25.清華大學計算機系課程攻略。

REKCARC TSC UHT

26.用Pytorch從新實現RetinaFace

RetinaFace Pytorch

27.RegExr是一個基於HTML/JS的工具,用於建立,測試和學習正則表達式。

regexr

28.spatial access:大規模計算旅行時間和空間訪問指標。大規模計算旅行時間和空間訪問度量(以分鐘爲單位的數百萬個起始 - 目的地對)。 三種模式的旅行時間:步行,騎自行車,駕駛。 空間訪問度量:提供者與人的比率,平均到最近的提供者的時間,附近提供者的計數/屬性總和,加權訪問分數和浮動彙集區。

spatial access

29.這是OSIG項目,用於發佈開放數據和開放材料開放科學中心徽章,以便在會議演示和海報上顯示。該項目的目的是經過公開提供他們的數據,代碼和其餘研究產品來承認考古學家爲改善考古學中的學術交流所作的努力。

bagdes for open practices

30.將任何草圖轉換爲單個數學公式。

sketch2math

31.SpaceNet道路檢測和導航挑戰競賽的優勝解決方案。

RoadDetector

2 Paper:

1.National NO2 exposure models for measuring its impact on vulnerable people in the US metropolitan areas/國家二氧化氮暴露模型,用於衡量其對美國大都市地區脆弱性人羣的影響

流行病學研究須要準確預測空氣污染物的濃度。在這項研究中,基於衛星的估計(OMI NO2),距離加權模型(DWMs)和普通克里金法(UK)被應用於土地利用迴歸(LUR),以預測美國大陸的年平均和每個月平均NO2濃度。此外,爲了評估環境風險,在377個大都市統計區(MSAs)中探討了NO2濃度與城市地區可能暴露於NO2的人之間的關係。該研究的結果代表,將OMI NO2,UK和DWM組合應用於LUR,這個模型有最高的交叉驗證(CV)R2值和最低預測均方根偏差(RMSEP):82.9%和0.392。在年度模型中,ppb的平方根尺度和ppb的平方根尺度分別爲70.4-83.5%和0.408-0.518。此外,該模型提出了CV偏差項的空間無偏分佈。基於LUR的模型提供了更準確的NO2預測,城市地區的RMSEP低於農村地區。此外,本研究發現生活在城市地區的MSA人口較多,18歲如下兒童比例較高,可能會暴露於較高的NO2濃度。相比之下,居住在城市地區的人羣中,65歲以上老年人的百分比較高,可能會暴露於較低的二氧化氮濃度。這篇文章不只構建了一個二氧化氮濃度空間分佈LUR模型,而且考量了空氣污染對於脆弱性人羣的暴露影響。

2.Mapping annual land use changes in China's poverty-stricken areas from 2013 to 2018/2013年至2018年中國貧困地區土地利用年度變化狀況製圖

中國的目標是到2020年結束絕對貧困。爲實現這一目標,已經提出了一系列減貧政策和措施。做爲減貧的重要組成部分,中國貧困地區的土地利用也發生了相應的巨大變化。可是,這些地區的土地利用變化模式尚不清楚。有必要分析時空土地利用變化模式,以提供支持扶貧計劃的數據。在這項研究中,咱們提出了一個框架,用於繪製2013年至2018年中國貧困地區土地利用年度變化的圖表。2013年至2018年的Landsat 8地表反射率數據集(可在Google Earth Engine上得到)用於檢測耕地的變化土地,建築用地,水,植被和未利用的土地。計算土地利用轉移矩陣以描述轉變的特徵,並採用貝葉斯分層模型來研究時空土地利用變化模式。咱們的研究結果代表,在研究期間,耕地面積不斷減小,而建成的土地和植被逐漸擴大。主要的土地利用轉變發生在耕地和植被之間。各縣的地方趨勢代表土地利用變化存在明顯的區域差別。此外,重度貧困縣和普通貧困縣之間在耕地和土地變動方面存在顯着差別,代表正常貧困地區的人類建設活動更爲激烈。爲貧困地區產生的年度土地利用製圖結果,以及對整體時間變化和地方變化趨勢的進一步分析,能夠更好地瞭解中國貧困地區的土地利用變化和區域差別,促進減貧和這些領域的可持續發展。地理所葛詠老師團隊的成果,發表於遙感頂刊環境遙感上,基於GEE分析中國貧困地區土地利用變化。在作土地利用分類的基礎上使用了貝葉斯分層模型來分析土地利用時空變化模式。同時對地觀測對於扶貧研究的做用可見一斑。

3.EmiStatR: A Simplified and Scalable Urban Water Quality Model for Simulation of Combined Sewer Overflows/EmiStatR:簡化和可擴展的城市水質模型,用於模擬聯合污水管溢流

許多複雜的城市排水質量模型計算量很大。當這些模型用於長時間序列的蒙特卡羅(MC)不肯定性分析時,複雜性和計算時間可能變得太高,特別是對於從業者。計算可擴展且快速的「替代」模型能夠減小實際應用的總計算時間,在實際應用中一般須要大數據集。咱們開發了一個簡化的半分佈式城市水質模型EmiStatR,它爲從業者提供了城市排水水質模型的不肯定性和敏感性分析。其對輸入數據的較低需求及其可擴展性容許快速有效地模擬多個集水區的下水道溢流中的水量和污染負荷。在EmiStatR中實現的可伸縮代碼顯着減小了計算時間(使用32個內核時減小了大約24倍)。經過使用MC不肯定性研究或長期模擬,能夠有效地應用EmiStatR來檢驗假設。一個面向業界的城市水質模型,能夠模擬聯合污水管溢流,也能夠作模型不肯定性分析和敏感性分析。事實上空間數據的不肯定性、精度在將來都是很是重要的研究,過去因爲數據匱乏,在這方面研究較少,可是大數據時代提供的各類海量數據爲咱們提供了這方面研究的數據基礎。

4.Analysing the Space–Time Distribution of Soil Water Storage of a Forest Ecosystem Using Spatio-Temporal Kriging/利用時空克里格法分析森林生態系統土壤水時空分佈

在森林中,土壤水分平衡受樹種組成的強烈影響。例如,蒸騰速率的差別致使土壤水儲存(SWS)的差別,而且冠層截留的差別致使滲透的差別。爲了分析樹種組成對森林尺度的SWS的影響,咱們比較了植被和SWS的時空模式。地質統計時空模型爲從點觀測中繪製SWS提供了機率框架。經過結合有關蒸發蒸騰過程的知識,能夠提升這些模型的準確性。在本文中,咱們將物理肯定性蒸散模型與時空地質統計插值結合起來,預測土壤上部30 cm土壤(SWS30)的土壤蓄水量,在挪威雲杉(Picea abies(L。 Karst。)和歐洲山毛櫸(Fagus sylvatica L.)在下奧地利州Kreisbach。經過永久安裝的波導在198個位置測量土壤儲水量。在2000年和2001年的生長季節中,大約每兩週重複28次。在SWS30的時空預測中加入基於過程的模型下降了降水對降水前SWS30預測的影響。 SWS30在永久萎point點和田間持水量之間的空間格局取決於受植被影響的降水和乾燥歷史。在生長季節的早期,雲杉開始明顯蒸發,這在針葉樹中很常見。在乾燥期間,雲杉比山毛櫸更早地減小蒸騰。在生長季節,整個山毛櫸的蒸騰比雲杉更多。山毛櫸的較大蒸騰速率可經過降水後更大的土壤水補給獲得補償,由於截獲的降雨量較少。在永久萎point點附近的低水含量下,SWS30在空間上很是均勻。這也是水含量近場容量的狀況,多是由於土壤物理參數變化很小。 SWS30的時空插值以及乾燥和溼潤期間土壤水分排放和土壤水分補給的預測證實了植被對SWS30空間格局的重要做用。這篇文章基於長期點觀測數據、物理肯定性過程蒸散模型和時空地統計插值結合,預測森林生態系統的土壤水時空分佈。儘管是篇很早的研究,但事實上是一篇很是有意義的研究,將地面觀測數據、過程模型與空間統計結合起來進行探究,是一個很是有意思的研究,這個研究的結論同時也能夠爲森林生態系統的生態系統模型提供不少關於碳水平衡、循環的先驗知識。

5.Mapping Water-Table Depths Over Time to Assess Desiccation of Groundwater-Dependent Ecosystems in the Netherlands/隨着時間的推移繪製水位深度,以評估荷蘭地下水依賴生態系統的乾旱狀況

在過去幾十年中,荷蘭地下水依賴的生態系統受到地下水位降低的威脅。可是,關於水位深度和水位深度變化的信息是不充分和過期的。對於政策評估,須要有關水位深度的空間明確和詳細信息,特別是在具備地下水依賴性生態系統(包括溼地)的地區。自1980年以來,在土壤調查期間,對天然保護區的水位深度的季節性波動特徵進行了大約35,000次觀測。這些觀測結果來自土壤剖面的特徵或鑽孔中的測量結果。這些觀測結果用於時空地質統計分析,以繪製1980年至2007年間水位深度的季節性波動。首先,糾正了多年來使用的不一樣估算模式之間的系統差別。接下來,使用多元線性迴歸將觀察與區域範圍內的可用輔助數據相關聯。使用簡單克里金法來插值獲得的時空殘差。預測的平均泉水位深度的地圖和這些預測的準確性被用於識別水位深於有利的區域。評估了過去25年來全國範圍內水位深度的變化,並提出了建議,以提升將來預測的準確性。利用時空地統計方法與長期觀測數據來分析全國範圍內水位深度變化研究,本文的思想實際是迴歸克里格。

6.A novel bus-dispatching model based on passenger flow and arrival time prediction/一種基於客流和到達時間預測的新型公交調度模型

公共交通對人們的平常出行相當重要,公共汽車調度在公共交通系統中發揮着重要做用。隨着深度學習的普遍應用,並在許多領域取得了巨大的成功,相繼提出了基於深度學習的公交調度方法。目前,許多公交調度模型假設公交出發時刻表是固定的,並根據客流優化公交出發時刻表間隔。可是,巴士出發時間表通常是可變的,只考慮到巴士到達時間不足。針對上述挑戰,咱們提出了一種基於到達時間和客流預測(D-ATPF)的新型動態公交調度模型。首先,經過處理公交車軌跡數據和乘客刷卡記錄得到歷史起點 - 目的地(OD)數據和傳輸數據,並經過分析GPS軌跡來提取公交車到達時間。其次,採用基於長短時間記憶(P-LSTM)的公交到達時間和客流預測的組成部分來預測將來的客流量和公交車到達時間。第三,基於遺傳算法的公交調度模型(GABD模型)經過使用停留策略搜索乘客的最小等待時間。經過使用中國廣州市的5條線路,124條公交車站和902,509條記錄的數據,咱們的實驗結果代表:a)乘客預測的平均MAPE和RMSE分別爲14%和7.5。 b)公交車到達時間的平均MAPE和RMSE分別爲7.5%和13.5。 c)關於客流量和到達時間預測,擬議的DATPF模型減小了等待時間829.68分鐘,佔總等待時間的25.19%。 d)與實時停留策略相比,該方法的等待時間減小了5.94%。所以,D-ATPF模型爲公交車調度提供了更實用的模型。深圳大學李清泉老師團隊成果,深度學習(典型模型長短時間記憶LSTM)、公交軌跡數據、乘客刷卡記錄數據、遺傳算法的耦合下的公交調度模型。從模型結果表現也很不錯。

7.Interactive Visualisation of Hierarchical Quantitative Data: an Evaluation/分層定量數據的交互式可視化:評估

咱們比較了用於分層定量數據的三種常見可視化:樹圖,冰柱圖和旭日形圖,以及咱們稱之爲日落圖的旭日圖表的半圓形變體。 在一項試點研究中,咱們發現旭日形圖是最不受歡迎的。 在一項有12名參與者的對照研究中,咱們比較了樹圖,冰柱圖和日落圖。 Treemap是最不受歡迎的,在基本導航任務上性能較慢,在層次結構理解任務中性能和準確性較低。 冰柱圖和日落圖具備相似的性能,用戶對冰柱圖的偏好較小。一篇關於可視化方式的論文,同一個數據不一樣可視化方式對於讀者的觀感是不一樣的。這也是可視化逐漸在這個時間成爲了一門重要的分支學科的緣由。

8.An enhanced bloom index for quantifying floral phenology using multi-scale remote sensing observations/使用多尺度遙感觀測來量化花卉物候的加強的綻開指數

花卉物候,開花的時間和強度,與生物的繁殖和生存密切相關,對氣候變化高度敏感。然而,開花的觀測記錄很是稀少,限制了咱們對從地方到區域尺度的花卉物候的時空動態的理解。衛星遙感提供了獨特的機會,以經濟有效的方式經過空間和時間監測花卉。在這裏,咱們開發了一個加強的水華指數(EBI),基於多光譜遙感數據來量化加利福尼亞中央山谷杏仁(Prunus dulcis)果園的開花情況。咱們對2.6-5.2釐米無人機(UAV)多光譜圖像的測試研究代表,EBI加強了花的信號,減小了土壤和綠色植被的背景噪聲,並與監督分類獲得的花朵覆蓋率一致, R2爲0.72。 CERES天線(0.2米),PlanetScope(3米),Sentinel-2(10米)和Landsat(30米)衛星圖像的多尺度遙感觀測實驗測試進一步顯示了EBI捕獲花的穩健性信息。咱們發現PlanetScope和Sentinel-2圖像的相對密集的時間序列可以捕獲杏仁果園的綻開動態。預計衛星衍生的EBI將跟蹤開花信息,從而提升咱們對花和授粉對天氣的響應以及最終產量的理解和預測。發表於攝影測量Top雜誌的ISPRS Journal of of Photogrammetry and Remote Sensing。基於光學遙感、多光譜、無人機等多尺度遙感觀測實驗,利用一個加強的水華指數來監測花卉物候變化。植被物候的一個研究,多尺度研究一直是地學很須要的研究。這篇文章在無人機的新型遙感技術下支撐起的多尺度多衛星監測實驗分析頗有意義。

9.Risk Reduction Behaviors Regarding PM2.5 Exposure among Outdoor Exercisers in the Nanjing Metropolitan Area, China/南京都市區戶外運動員PM2.5暴露的風險下降行爲

目的:本研究旨在描述戶外運動者中直徑爲2.5μm或更小(PM2.5)的環境顆粒物的風險下降行爲,並探討影響中國南京城區行爲的潛在因素。方法:2015年5月對302名戶外運動員進行了橫斷面便利抽樣調查。描述性分析用於描述人口統計學,戶外體育活動模式,PM2.5知識和風險下降行爲。而後使用多變量邏輯迴歸分析來探索影響風險下降行爲採用的因素。結果:減小PM2.5暴露的最多見行爲是在朦朧日(75.5%)最小化打開窗戶的時間,最不常見的是使用空氣淨化器(19.3%)。三分之二的受訪者表示,他們在陰霾中外出時戴着口罩(59.5%),但只有13.6%的人會戴專業的防靜電口罩。採用PM2.5暴露風險下降行爲的參與者每每是女性,50-60歲,PM2.5知識水平較高的人和有孩子的人。結論:這些發現代表了提升戶外運動員對PM2.5知識的重要性。在高PM2.5污染地區進行戶外運動時,還必須採起教育干預措施,引導公衆採起適當的預防措施。利用一個戶外運動員的斷面抽樣調查來分析PM2.5的暴露風險。從目前來看,不少PM2.5的預防和控制措施知識十分欠缺。

10.Enhanced aerosol estimations from Suomi-NPP VIIRS images over heterogeneous surfaces/Suomi-NPP VIIRS影像在異質表面上的加強氣溶膠估算

Suomi國家極地軌道合做夥伴關係(NPP)上的可見紅外成像輻射計套件(VIIRS)是新一代極軌衛星成像傳感器。它產生了與普遍使用的中分辨率成像光譜儀(MODIS)產品相似的各類操做產品。然而,基於先前的驗證,官方VIIRS氣溶膠產品存在很大的不肯定性,須要減小這些不肯定性才能充滿信心地使用。爲此,咱們開發了一種通過修訂的高空間分辨率氣溶膠反演算法,該算法能夠顯着提升氣溶膠光學厚度(AOD)估計值。這些改進主要來自(i)使用RossThick-LiSparse模型校訂表面雙向反射,其中參數來自MODIS雙向反射分佈函數(BRDF)/反照率產品; (ii)根據歷史AERONET光學特性測量假設的更精細定製的每個月氣溶膠類型; (iii)利用修正的動態閾值雲檢測算法改進像素選擇。新的750米分辨率AOD反演通過氣溶膠觀測網絡(AERONET)第3版AOD測量驗證,並與2014年至2017年在中國京津冀地區的官方VIIRS AOD產品進行了比較。結果代表,反演與地面觀測結果高度一致(R = 0.926),其中約72%在區域範圍內落在[±(0.05 + 20%)]的預期偏差範圍內。平均絕對偏差爲0.082,均方根偏差爲0.120。與官方氣溶膠產品相比,修正後的算法能夠顯着下降過分估計並改善異質城市表面的氣溶膠估算,特別是在冬季。所以,這種新的VIIRS AOD產品將更適用於城市地區等異質表面的空氣污染研究。發表於IEEE TGRS的一篇AOD反演的文章,提出了一種改進的算法,能夠適用於城市地區異質性較強的地區的空氣污染研究。

11.Quantitative analysis of the contributions of climatic and human factors to grassland productivity in northern China/中國北方氣候和人爲因素對草地生產力貢獻的定量分析

準肯定量分析氣候變化(CC)和人類活動(HA)對草地生產力的貢獻對於闡明相關的驅動機制相當重要。在這項研究中,分析了中國北方的草原。咱們選擇淨初級生產力(NPP)做爲草地生產力的評估指標,並肯定了氣候和人爲因素在NPP變化中的相對做用。基於偏導數的定量方法用於評估氣候因子對NPP變化的貢獻,NPP的年際變化率與氣候因子貢獻之間的差別被認爲是HA貢獻。而後,設計了不一樣的情景來評估CC和HA對草地恢復和退化的相對貢獻比例。結果代表,2000〜2015年,中國北方平均草地NPP呈顯着增長趨勢。溫度,降水和太陽輻射對草地NPP變化的貢獻爲0.06,0.50和0.52gCm-2。太陽輻射在全部氣候因素中起到了最大的積極做用,其次是降水。 CC和HA對草地NPP變化的貢獻分別爲1.08和0.58gCm-2。此外,HA在草地恢復和退化中的做用大於CC。整體而言,HA對草地生產力的積極影響可能會被其負面影響大大抵消,所以HA對草地NPP變化的積極貢獻小於CC。所以,應進一步增強用於控制草地退化的有效措施和政策,以保護草原資源。氣候變化和人類活動對NPP的研究,我想應該來講仍是一個比較通用的topic,幾個關鍵的因素從生態模型方面的先驗知識也是比較準確的,同時人類活動的影響對草地NPP的影響仍是比較顯著的。這幾年草地NPP增長應該與國家退耕還林還草政策有很大相關,這跟前段時間Nature Sustainability的雄文結果仍是比較一致的。

相關文章
相關標籤/搜索