In machine learning, the term "ground truth" refers to the accuracy of the training set's classification for supervised learning techniques. This is used in statistical models to prove or disprove research hypotheses. The term "ground truthing" refers to the process of gathering the proper objective (provable) data for this test. Compare with gold standard.學習
Ground: 地基、地板。意思就是地板上的真相,基礎事實。注意這個詞用在監督學習上的,只有監督學習有 Ground Truth。意思是給機器訓練用的標定數據的準確率。在樸素貝葉斯方法訓練垃圾郵件分類的任務中,人工標註的結果就是一個 ground truth。對比的名詞是 Gold standard,統計學上意思是在合理條件(人類可實現)下可以達到的最好結果。(等於廢話,什麼都沒說。這個最好結果跟正無窮同樣,是一個理論值)。
統計學中的概念,擬合值和觀測值的差距。若是迴歸模型正確的話,能夠將殘差看做偏差的觀測值。在迴歸問題中,殘差就是迴歸結果跟 ground truth 的差距?粗暴一點理解就是模型尚未學到的那部分東西,M$ 的 ResNet 2015 年提出這個東西。
