在數據分析的過程中,我們會通過觀察一系列的特徵屬性來對我們感興趣的對象進行分析研究,一方面特徵屬性越多,越有利於我們細緻刻畫事物,但另一方面也會增加後續數據處理的運算量,帶來較大的處理負擔,我們應該如何平衡好這個問題?利用矩陣的特徵值分解進行主成分分析就是一個很好的解決途徑。
主成分分析是機器學習中的核心算法之一,本文將基於 Python 語言,爲讀者深入淺出的分析他的來龍去脈和本質內涵,相信讀完此文,將掃清你心中的所有疑慮,今後在應用他解決實際問題的時候也能更加得心應手。
本場 Chat 主要內容有:
對稱矩陣的基本性質
對稱矩陣的對角化與特徵值
數據降維的需求背景與主要目標
主成分分析法降維的核心思路
主成分分析的細節實現過程
推廣到 N 個特徵的降維實現
本場 Chat 作者:張雨萌
1. 清華大學計算機科學與技術系碩士畢業,研究方向:數據分析、自然語言處理;
2. 受歡迎的知乎科技專欄作家,專欄關注量15000;
3. 個人已出版機器學習算法類技術書籍。
掃碼下方二維碼
查看完整 Chat 全文
▼
點擊閱讀原文,訂閱本場 Chat !