數據與挖掘 筆記3

1.標準化的方法 第一種 有上下限 比如最高的98000與最低的12000,定義73600爲(0,1)之間的一個值的公式。 第二種 無限,計算偏離值的方法。 2.描述數據的方式 平均數,中位數(用的較多),高頻數,方差:即Var(x) 3.A與B是否相關? 值得注意的是,當=0時,並不意味着無關,只是不呈線性相關。 叉狀表格,調查象棋與讀書的相關性,紅色框內是 本應該有的(expected)人數和
相關文章
相關標籤/搜索