我們在數據挖掘中迷失了什麼?

當我們沉浸在親手構建的模型裏的時候,是否會理智地跳出來,重新審視一下,我們所忽略的會不會正是客戶所需求的呢?   1.太關注訓練 就像體育訓練中越來越注重實戰訓練,因爲單純的封閉式訓練常常會訓練時狀態神勇,比賽時一塌糊塗。實際上,只有樣本外數據上的模型評分結果才真正有用! 栗子:機器學習或計算機科學研究者常常試圖讓模型在已知數據上表現最優,這樣做的結果通常會導致過度擬合( overfit )。 解
相關文章
相關標籤/搜索