A strategy to apply machine learning to small datasets in materials science

摘要:機器學習的方法在材料科學研究中的應用越來越廣泛。然而,與其他領域相比,材料數據集通常更小,有時更爲多樣化,但材料數據集的大小對訓練機器學習模型的影響還未有人進行研究,這阻礙了使用小樣本的材料數據集建立高精度的機器學習模型。本文分析了材料數據的大小和機器學習模型的預測能力之間的基本相互作用。結果顯示數據大小的影響不是直接影響模型的精度,而是通過影響模型的自由度(DoF),間接影響模型的預測精度
相關文章
相關標籤/搜索