前期作數據可視化,發現標籤數據存在一些孤立點(噪聲點),影響kmeans聚類。網絡
處理方法以下:工具
使用kmeans迭代10次獲得聚類中心opencv
計算全部數據到其聚類中心的歐式距離均值和方差數據可視化
經過擬合正態分佈,把到聚類中心距離大於均值+1.96*方差的點剔除訓練集(根據正態分佈0.95面積算的)可視化
獲得新的訓練集以及anchor方法
以上方法並不徹底適應yolo計算anchor的需求(與yolo網絡自己有關)數據
建議使用darknet自帶的anchor計算工具,而非opencv的kmeans工具。標籤