數據科學家應瞭解的內容

一、數據挖掘正則表達式

變量規約、隨機森林、生存分析、兩階段建模、序列分析、關聯規則、k折交叉驗證、自組織映射、支持向量機、層次聚類、情感分析、協同過濾、神經網絡、k均值聚類、k近鄰、樸素貝葉斯、Boosting、決策樹、過擬合、Lift、預測算法、分類算法、訓練驗證測試集、變量角色、無監督學習、有監督學習、字符變量、數值變量、ML基礎算法

 

二、可視化數據庫

可視化探索、移動可視化、儀表盤、條圖餅圖線圖、散點圖面積圖、氣泡圖、直方圖、地圖、動態交互圖形、熱力圖瓦片圖、詞雲、網絡圖桑基圖、Mashup、時序動畫編程

 

三、數據庫安全

數據接口規範、數據映射、數據質量、數據變換、數據整合、ABT、SQL、抽樣、數據分區、變量選擇、標準化、數據模型、3NF、數據冗餘、逆規範化、數據壓縮、數據安全網絡

 

四、文本挖掘數據結構

中文分詞、文本分類、文本聚類、實體解析、特徵抽取、概念連接、詞頻權重、TFIDF、倒排索引、語料庫、多語種、副本識別、本體管理、信息檢索、短語識別、拼寫檢查、情感識別、語境分析函數

 

五、基礎oop

矩陣計算、線性代數、數據結構、關係代數、數據庫原理、錶鏈接、表格數據、數據框、時間序列、數據分片、多維數據、ETL、報表、BI、Jason、XML、NoSQL、正則表達式、主流廠商、環境設置性能

 

6、編程

P值、卡方檢驗、估計、置信區間、MLE、迴歸、統計分佈、誤差、相關係數、最小二乘、歐式距離、Python基礎、探索分析、R基礎、SAS、向量矩陣、讀取數據、抽取子集、數據框處理、函數、安裝軟件包、數據步、過程步、Web Service、存儲過程、宏、參數傳遞、SQL、繪圖、網頁爬取

 

七、大數據

物聯網、移動互聯網、互聯網徵信、社交媒體分析、SNA、LBS、網絡計算、HBase、高性能分析、ESP、內存分析引擎、Spark、Hive、M/R編程、任務管理、數據節點、主節點、平臺搭建、數據複製、HDFS、MapReduce、Hadoop、精準營銷、客戶DNA、工業4.0、人才羅盤、設備預維護、CAP理論、車聯網、傳感器、輿情監控

 

八、統計學

累積分佈函數、隨機變量、貝葉斯理論、機率論、異常值、What-If分析、分位數、探索分析、描述統計、數據集、假設檢驗、蒙特卡洛、中心極限定理、機率密度函數、ANOVA、迴歸、峯度偏度、誤差

相關文章
相關標籤/搜索