Coding and Paper Letter(六十三)

資源整理。git

1 Coding:

1.USGS StreamStats客戶端應用,基於typescript。github

StreamStats算法

2.與ngraph.louvain相似,此模塊使用Louvain方法檢測圖形中的聚類。spring

ngraph.louvain.nativedocker

3.R語言包fastlmm,分形光譜變換線性混合模型。typescript

fastlmm數據庫

4.R語言包bigFastlm,從新實現RcppEigen的fastLm函數用於big.matrix對象的快速內存線性模型擬合。apache

bigFastlm網絡

5.浙江大學課程攻略共享計劃。併發

zju icicles

6.開源的天然語言處理研究庫,基於Pytorch構建。

allennlp

7.R語言包ordinal,序數數據的迴歸模型。

ordinal

8.西部山區湖泊數據庫。

WML database

9.用於跟蹤天然語言處理(NLP)進度的存儲庫,包括數據集和最多見的NLP任務的當前最新技術。

NLP progress

10.Python庫sklearn bayes,使用scikit-learn API進行貝葉斯機器學習。

sklearn bayes

11.用於R中可重複研究的可靠資源列表包括不一樣工具的比較表。

awesome reproducible R

12.R語言包nomnoml,爲nomnoml提供了一個R接口,這是一個基於語法和可定製樣式繪製時髦UML圖的工具。

nomoml

13.Pardiso.jl包提供了使用Julia語言的PARDISO 5.0和Intel MKL PARDISO的界面。 若是沒有PARDISO的有效許可證或安裝了MKL庫,則沒法使用Pardiso.jl。 此軟件包是免費提供的,毫不會替換或更改連接庫的任何功能。

Pardiso

14.用於基因組預測的分佈式AI-REML最佳線性無偏預測框架,包括逐環境交互。該軟件已在手稿針對中進行了描述和驗證:經過逐個環境的相互做用進行大規模基因組預測。

Needles

15.任意模糊核的深度即插即用超分辨率重建,CVPR2019論文。

DPSR

16.發現並安裝有用的RStudio插件。

addinslist

17.Hugo的whisper主題。

hugo whisper theme

18.R語言的torch,深度學習的庫。

torch

19.R語言包textfeatures,用於從字符對象中提取有用功能的簡單包。

textfeatures

20.Kaggle 項目實戰(教程) = 文檔 + 代碼 + 視頻(歡迎參與)。

kaggle

21.結構化算法刷題訓練指南。

awesome algorithm

22.Machine Learning Mastery 博客文章翻譯

ml mastery zh

23.AiLearning:機器學習 - 機器學習 - ML,深度學習 - DeepLearning - DL,天然語言處理NLP。

AiLearning

24.Docker配置,圖像以及Dockerfiles for Oracle產品和項目示例的官方來源。

docker images

25.深刻學習,Berkeley STAT 157(2019年春季)教科書。 使用代碼,數學和討論。

d2l en

26.Open Long-Tailed Recognition(OLTR)是做者從新實現的長尾識別器,「"Large-Scale Long-Tailed Recognition in an Open World」 做者:Ziwei Liu, Zhongqi Miao, Xiaohang Zhan, Jiayun Wang, Boqing Gong, Stella X. Yu (CUHK & UC Berkeley / ICSI)。 參加IEEE計算機視覺與模式識別會議(CVPR)2019,口頭報告。

OpenLongTailRecognition OLTR

27.「具備缺失值的Logistic迴歸的隨機逼近EM」的代碼和實現。

miSAEM logReg

28.隱式重啓Arnoldi方法,原生Julia實現。

ArnoldiMethod.jl

29.R語言包StanSensitivity,用於在Stan中自動生成局部靈敏度測量的工具。

StanSensitivity

30.R語言包rtemis,高級機器學習研究和應用的平臺。rtemis的目標是使數據科學無障礙且高效,同時不影響靈活性。

rtemis

31.R語言包zipcodes,提供美國40569個郵政編碼的城市,縣,州,縣FIPS代碼和州FIPS代碼。

zipcodes

32.pytrec eval是Python的信息檢索評估工具

pytrec eval

33.R中學習和使用GAM的資源。

gam resources

34.R語言包printr,這是knitr的配套包。

printr

35.使用hadoop,flume,hive和R(igraph)的twitter數據的社會網絡分析。

tweetonomy

36.R語言包vitae,使用簡單的R Markdown建立和維護簡歷或簡歷。 它提供了一系列LaTeX模板,以及向文檔添加內容的有用功能。

vitae

37.PlusCal中的算法示例,Lamport的TLA +的算法語言。

PluCal Exmamples

38.關於貝葉斯建模的因果推斷的論文。

causal bayes

39.該存儲庫是ASPRS LAS工做組(LWG)的官方協做編輯環境。 咱們負責維護ASPRS LAS規範,這是遙感行業最普遍使用的點雲數據文件格式。

LAS

40.Python中天文時間序列的通用工具。

gatspy

41.關於R的本科課程的幻燈片。

Intro to R Reader

42.Python庫imcmc,用於將2d圖像轉換爲機率分佈,而後從中進行採樣以建立圖像和GIF。 如今,它最適用於徽標和基於形狀的圖像。

imcmc

2 Paper:

1.A Remote Sensing Data Based Artificial Neural Network Approach for Predicting Climate-Sensitive Infectious Disease Outbreaks: A Case Study of Human Brucellosis/基於遙感數據的人工神經網絡預測氣候敏感傳染病爆發:人類布魯氏菌病的個案研究

遙感技術能夠準確地捕捉環境特徵,並與環境建模方法一塊兒幫助預測氣候敏感的傳染病爆發。布魯氏菌病在馴養動物和人類中仍然在世界範圍內猖獗。本研究使用人類布魯氏菌病(HB)做爲測試案例,以肯定疾病的重要環境決定因素並預測其爆發。利用年度縣級HB病例數據和37個環境變量數據開發了一種新的人工神經網絡(ANN)模型,可能與中國內蒙古的HB相關。 2006年至2008年的數據用於培訓,驗證和測試模型,而2009-2010的數據用於評估模型的性能。加強植被指數被肯定爲HB發生率的最重要預測因子,其次是地表溫度和其餘與溫度和降水相關的變量。基於這些預測因子對HB的合適生態位進行建模。在模型開發和評估階段,模型估計與HB報告的報告數量一致。該研究代表,可使用人工神經網絡模型和從衛星數據得到的環境變量,以合理的準確度預測HB爆發。該研究加深了對HB環境決定因素的理解,並推動了預測氣候敏感性傳染病爆發的方法。基於遙感與傳染病爆發的研究。首先考慮到了疾病的基本病理,接着考慮了比較容易影響疾病的幾個以及容易從衛星影像獲取的環境變量,基於神經網絡方法預測疾病爆發,很不錯的健康地理研究。

2.Quantifying the effects of using detailed spatial demographic data on health metrics: a systematic analysis for the AfriPop, AsiaPop, and AmeriPop projects/量化使用詳細的空間人口統計數據對健康指標的影響:對AfriPop,AsiaPop和AmeriPop項目的系統分析

千年發展目標(MDGs)促令人們擴大了得到健康指標的方法,以衡量實現這些目標的進展狀況。 準確的測量應考慮到各國健康風險的高度空間異質性,促使開發複雜的製圖技術以繪製風險並對其進行建模。 將這些風險轉換爲相關的基於人口的指標須要有關人口空間分佈和屬性的一樣詳細信息。 然而,缺少關於年齡和性別構成的空間信息,促使許多健康指標研究忽視了國家之外存在的實質性人口變化,僅僅應用了國家層面的調整。柳葉刀上的一篇文章,提出了高空間分辨率人口數據對健康研究的重要性。

3.Estimating the heights and diameters at breast height of trees in an urban park and along a street using mobile LiDAR/使用移動LiDAR估算城市公園和街道樹木胸徑的高度和直徑

因爲樹木能夠對城市生態系統中的局部環境產生積極影響,所以測量其形態特徵很是重要,例如胸徑(DBH)的高度和直徑。可是,爲每棵樹測量這些數據是一個耗時的過程,須要大量的人力。在這項研究中,咱們研究了使用移動LiDAR估算城市街道和城市公園的樹高和胸徑的可行性。咱們將移動LiDAR裝置的測量結果與城市公園和街道中樹高和胸徑的現場測量結果進行了比較。應用高度 - 地面和Pratt圓擬合方法分別計算樹高和DBH。 LiDAR估計的樹高度雖然略有低估,但很是準確,街道樹的均方根偏差爲0.359 m,公園樹的均方根偏差爲0.462 m。另外一方面,估計的DBH是中等準確和高估的,街道樹的均方根偏差爲3.77釐米,公園樹的均方根偏差爲8.95釐米。公園內密集種植的樹木和城市地區的障礙物會致使「陰影」(沒有數據的區域),從而下降準確性。不規則的幹線形狀和不包括每一個幹線的完整數據點覆蓋的掃描數據是致使錯誤的緣由。儘管存在這些錯誤,但本研究強調了使用移動地面激光雷達平臺得到的樹木測量的潛力,能夠從基於點的位置擴展到鄰域規模和城市規模的清單。利用移動地面激光雷達測量城市森林的胸徑高度和直徑,樹木胸徑自己就是生物量(碳儲量)的一個重要變量。這樣有利於評估城市森林在碳循環中的做用。

4.Exploring the impacts of anthropogenic emission sectors on PM2.5 and human health in South and East Asia/探討人爲排放部門對東亞和東亞PM2.5和人類健康的影響

爲了改善亞洲空氣質量差並提供有效的減排戰略,瞭解不一樣污染源的貢獻及其相關的人類健康負擔相當重要。在這項研究中,咱們使用WRF-Chem區域大氣模型來探索空氣質量和人類健康益處,以消除七個不一樣的人爲部門(運輸,工業,航運,農業,能源生產,住宅燃燒和開放生物質燃燒)的排放2014年南亞和東亞。咱們根據該地區空氣質量監測站的測量結果評估WRF-Chem,並發現該模型記錄了PM2.5的空間分佈和大小(該地區顆粒物質濃度爲2.5)。最大的人類健康益處經過消除住宅或工業排放來實現,分別在印度,中國和東南亞避免467 000(409 000-542 000)或283 000(95UI:226 000-358 000)年度過早死亡;避免防火28 000(95UI:24 000-32 000)該地區的年度過早死亡率。咱們將咱們的結果與以前的行業特定排放研究進行比較。根據這些研究,住宅排放是印度顆粒污染的主要緣由,多模型對人口加權年平均PM2.5的平均貢獻爲42%。住宅和工業排放在中國占主導地位,兩個部門的多模型平均貢獻率爲人口加權年平均PM2.5。將來的工做應側重於肯定住宅,工業和開放式生物質燃燒排放部門中最有效的選擇,以改善整個南亞和東亞的空氣質量。基於WRFF-Chem作的PM2.5分佈,接着與不一樣部門的排放清單進行分析,結合人口暴露,分析了健康效應以及減排的重點部門。

5.Local-scale landslide susceptibility mapping using the B-GeoSVC model/使用B-GeoSVC模型進行局部尺度滑坡敏感性繪圖

局部尺度的滑坡敏感性繪圖(LSM)爲決策和規劃提供了詳細信息。因爲忽略了空間異質性,大多數已發佈的滑坡敏感性圖缺少局部尺度的可靠信息。爲了豐富LSM的局部尺度信息,須要針對局部空間異質性的多種信息融合方法和控制因子的區域趨勢。然而,尚未爲LSM提出信息融合方法。在本文中,咱們在LSM的分層貝葉斯框架下開發了一種新的集成統計方法,名爲B-GeoSVC。具體而言,該模型應用GeoDetector方法擬合控制因子的區域趨勢,並採用空間變異係數(SVC)模型來擬合每一個控制因子的局部空間異質性。而後,區域趨勢和局部空間異質性信息融合在分層貝葉斯框架內。 B-GeoSVC模型使用來自中國杜文盆地的數據進行驗證,該盆地位於受2008年5月12日MS 4.0汶川地震影響的中部地區。在交叉驗證明驗中,預測準確率爲B-GeoSVC模型爲86.09%,曲線下面積爲0.93,這代表B-GeoSVC模型可以實現相對準確的局部尺度LSM,並提供比傳統區域尺度LSM更豐富的局部信息。更重要的是,不只能夠將B-GeoSVC模型用做融合滑坡測繪的區域和地方尺度信息的通常解決方案,並且還能夠爲更普遍的地球科學和空間統計提供新的看法。基於Geodtector加上分層貝葉斯框架,開發了一個B-GeoSVC模型,對滑坡進行預測,實現滑坡製圖。考慮了空間異質性的該模型,精度更高,融合了多源信息,這種思想也能夠借鑑到其餘方面研究中。

6.Joint treatment of point measurement, sampling and neighborhood uncertainty in space-time rainfall mapping/時空降雨製圖中點測量,採樣和鄰域不肯定性的聯合處理

各類水文研究都強調了準確表示降雨空間結構的重要性。人們還廣泛認可,須要考慮降雨量輸入的不肯定性。常見方法側重於計算降雨量估算中的點測量或採樣不肯定性。咱們提出了一種方法,共同考慮影響降雨時空製圖的三個不肯定性來源:點測量,採樣和鄰域不肯定性。據咱們所知,任何先前的降雨不肯定性分析都沒有包括鄰域不肯定性。咱們在丹麥西部(1055平方千米)的一個集水區以2千米x 2千米的空間分辨率生成了400個日降雨量場的集合。咱們方法的核心是順序高斯模擬(SGS)技術。結果代表咱們的方法可以重現降雨分佈的關鍵統計特徵。咱們研究了不一樣空間(網格和流域)和時間支持(一天,一個月,五年)對整體不肯定性的影響。咱們還量化了每一個不肯定性來源對降雨場不肯定性的影響。最後,咱們將模擬結果與專家啓發研究的結果進行了比較。咱們發現,5年內平均流域降雨量的專家引起不肯定性遠大於咱們研究中的量化(CV爲1.1%對5%)。測量雨量的5年平均值發現了更大的差別,其中專家引起致使的值高出一個數量級(CV爲0.2%對2%)。討論了這種差距的可能緣由。降雨製圖的不肯定性分析,很是有意思的一個研究,首先是分析了三個不肯定性源,接着模擬一個數據並分析不肯定性同時與專家啓發研究的結果進行不肯定性對比。空間數據不肯定性分析的一個很好的樣例研究。

7.Fine particulate (PM2.5) dynamics before and after China’s 「Reform and Opening up」 policy in Shenzhen/中國「深圳改革開放」政策先後的細顆粒物(PM2.5)動態

瞭解城市化與空氣污染之間的權衡能夠爲城市可持續發展提供重要的看法。因爲PM2.5記錄的可用性,PM2.5在中國的這種狀況很是罕見。所以,咱們根據PM2.5是PM10的主要成分,PM2.5與深圳氣象能見度具備顯着關係來估算1973-2017年深圳長時間PM2.5濃度。咱們發現深圳的PM2.5濃度經歷了倒U型變化,緩慢增長,快速增長,保持高水平,緩慢減小和快速減小的五個不一樣階段。深圳的PM2.5濃度動態並未徹底遵循EKC的倒U形而是M形。這項研究的結果不只爲中國其餘城市提供了一個實例,並且還建議中低收入國家的其餘城市經過更好地關注發展與污染之間的權衡來發展。 分析了深圳PM2.5的變化,尤爲是改革開放先後,此次的EKC終於再也不是喜聞樂見的倒U形而是M形,也是一個比較有意思的點。

8.Investigating the differentiated impacts of socioeconomic factors and urban forms on CO2 emissions: Empirical evidence from Chinese cities of different developmental levels/調查社會經濟因素和城市形態對二氧化碳排放的差別影響:來自不一樣發展水平的中國城市的經驗證據

爲減小人類活動中普遍存在的二氧化碳(CO2)排放,以往的研究很是重視城市社會經濟發展,城市形態和二氧化碳排放之間的關係,並經過有效的城市空間規劃提供相關的減排政策。然而,是否以及如何影響二氧化碳排放水平的城市形態的不一樣特徵(如緊湊性)仍然存在爭議,特別是考慮到城市的不一樣發展水平。所以,本研究旨在綜合探討社會經濟因素和城市形態如何共同影響二氧化碳排放,同時考慮到中國五個城市層級發展水平的差別。首先,每一個城市的二氧化碳排放來自省級能源統計,輻射校準的夜間燈光遙感影像和基於分解模型的人口分佈數據。而後,分別從城市統計和土地利用數據中獲取一組表明社會經濟因素和城市形態的變量。在從1995年到2015年得到這五個城市層級的平衡數據集以後,最終應用面板數據分析來評估社會經濟因素和城市形態在不一樣發展階段對二氧化碳排放的影響。估算結果代表,經濟發展,人口增加和城市土地擴張是加速城市二氧化碳排放的重要因素。此外,因爲全部城市層級的潛在運輸需求增長,城市土地使用的不規則或分散結構可能致使更多的二氧化碳排放。值得注意的是,城市核心區域日益集中的模式被發現會增長一線城市的二氧化碳排放量,但會促進其餘四個城市層級的二氧化碳排放量的減小。具備緊湊和多核模式的城市空間發展被認爲與較低水平的二氧化碳排放密切相關。這些結果突出了城市發展水平對於減緩二氧化碳排放的決策的重要性,並從社會經濟發展和城市空間規劃的角度爲建設低碳城市提供科學支持。利用面板數據分析二氧化碳排放的影響。基於統計年鑑數據、夜間燈光遙感以及人口數據獲得的。給出了一些宏觀意義的減排政策。

相關文章
相關標籤/搜索