基於TensorFlow理解三大降維技術:PCA、t-SNE 和自編碼器

在咱們開始以前,先看一個問題:若是你要爲如下案例選擇一種降維技術,你會怎麼選?數據庫

1. 你的系統能夠使用餘弦類似度測量距離,但你須要將其可視化,以便不懂技術的董事會成員也能理解,這些人可能甚至歷來沒據說過餘弦類似度;你會怎麼作?可視化

2. 你有必要將數據的維度壓縮到儘量最低,你的限制是要保留大約 80% 的數據,你會怎麼作?方法

3. 你有一個數據庫,其中的數據是耗費了大量時間收集的,並且還時不時有新的(類似類型的)數據加入。你須要下降你已有數據的維度,而且還要給到來的新數據降維,你會選擇什麼方法?技術

這篇文章的目的是但願能幫助你更好地瞭解降維,以便你能輕鬆應對相似這樣的問題。數據

 https://www.sohu.com/a/157563698_465975時間

相關文章
相關標籤/搜索