ML基礎 | 一文詳解正態分佈(附python實現)

正態分佈簡介
ML基礎 | 一文詳解正態分佈(附python實現)
你據說過鐘形曲線嗎?它每每是全球人們討論最多的話題之一。很長一段時間以來,鐘形曲線決定了對員工的專業評估,能夠是一個受人喜好或使人恐懼的話題,而這取決於與誰交談!
看看這張圖片:
ML基礎 | 一文詳解正態分佈(附python實現)
你認爲曲線的形狀意味着什麼?做爲一個數據科學家(或一個有抱負的科學家),你應該可以立刻回答這個問題。在許多其餘應用中,鐘形曲線背後的思想是正態分佈。
正態分佈是統計學的核心概念,是數據科學的支柱。在進行探索性數據分析時,咱們首先探索數據,而目的是找出其機率分佈,對嗎?猜猜看,最多見的機率分佈是什麼?就是正態分佈。
看看這三個很是常見的正態分佈示例:
ML基礎 | 一文詳解正態分佈(附python實現)
ML基礎 | 一文詳解正態分佈(附python實現)
ML基礎 | 一文詳解正態分佈(附python實現)
你能夠清楚地看到,出生體重、智商得分和股價回報率每每造成一個鐘形曲線。一樣,還有許多其餘的社會和天然數據集遵循正態分佈。
正態分佈對數據科學家來講變得相當重要的另外一個緣由是中心極限定理,這個定理解釋了數學的魔力,是假設檢驗的基礎。python

咱們稱這條鐘形曲線爲正態分佈,卡爾·弗里德里希·高斯發現了它,因此有時咱們也把它稱爲高斯分佈。
咱們只需使用兩個參數便可簡化正態分佈的機率密度:平均值ide

相關文章
相關標籤/搜索