#皮爾遜相關係數: 用於度量兩個變量X和Y之間的相關(線性相關),其值介於-1與1之間python
from scipy.stats import pearsonr x = [0.5, 0.4, 0.6, 0.3, 0.6, 0.2, 0.7, 0.5] y = [0.6, 0.4, 0.4, 0.3, 0.7, 0.2, 0.5, 0.6] print(pearsonr(x, y)) # 輸出:(r, p) # r:相關係數[-1,1]之間 # p:相關係數顯著性
相關性的強度確實是用相關係數的大小來衡量的,但相關大小的評價要以相關係數顯著性的評價爲前提spa
所以,要先檢驗相關係數的顯著性,若是顯著,證實相關係數有統計學意義,下一步再來看相關係數大小,若是相關係數沒有統計學意義,那意味着你研究求得的相關係數也許是抽樣偏差或者測量偏差形成的,再進行一次研究結果可code
能就大不同,此時討論相關性強弱的意義就大大減弱了。【「The p-values are not entirely reliable but are probably reasonable for datasets larger than 500 or so.」,p-value在500個樣本值以上有較高的可靠性】blog
在知足相關係數顯著的條件下,相關係數越大,相關性就越強ip