機器學習機基礎總結(一)數據清洗

數據清洗 Pandas Fuzzy-Levenshtein distence Fuzzywuzzy提供了語言的模糊查詢或者替換等 PCA主成分分析 PCA主成分分析算法(Principal Components Analysis)是一種最常用的降維算法。能夠以較低的信息損失(以樣本間分佈方差衡量)減少特徵數量。 PCA算法可以幫助分析樣本中分佈差異最大的成分(主成分),有助於數據可視化(降低到2維
相關文章
相關標籤/搜索