數據挖掘常見面試題(持續更新中)

1、你理解什麼是數據挖掘? 數據挖掘就是由數據準備,數據挖掘和對結果的解釋評估三部分組成。數據準備包括數據選取,數據預處理和數據變化。數據挖掘部分包括確定挖掘的任務或目的,選擇挖掘算法。最後將結果可視化或者轉化爲易於理解的形式。 2、爲什麼會產生過擬合,有哪些方法可以預防或克服過擬合?(常問問題) 所謂過擬合(Overfit),是這樣一種現象:一個假設在訓練數據上能夠獲得比其他假設更好的擬合,但是
相關文章
相關標籤/搜索