吳恩達機器學習筆記——獲取大量數據與人工數據

更多訓練樣本的取得 我們可以通過對已有的真實數據集拉伸扭曲、增加噪聲的引入失真方式創造更多衍生數據集。 也可以利用一些工具創造數據集,如下載各種字體人工隨機放置在不同背景中。 使用衆包平臺。 大量數據生效的前提 而保證工具的可用性,除了提高數據集的數目,還應該預先保證模型本身的低偏差。 我們可以通過繪製學習曲線的方式檢查分類器以保證我們擁有一個低偏差、高方差的分類器。 如果偏差較高,我們可以增加特
相關文章
相關標籤/搜索