福大軟工 · BETA 版衝刺前準備(團隊)

寫在前面

過去存在的問題

算法組

  • 沒有考慮到數據集不充足的狀況。一開始咱們將全部數據集按照8:1:1進行分割,分別分配給訓練集、開發集和測試集。然鵝後來發現採集到的數據不夠充足,這麼分割訓練效果不理想。
  • 因爲本次數據數量有限,致使CRNN文字識別模塊雖然能達到很高的識別正確率,可是泛化性始終不能達到預期的效果。以及對於添加摩爾紋或者被障礙物遮擋這方面的數據集不在訓練集中,致使上述圖片的識別效果很差。

開發組

  • 因爲咱們的算法對服務器要求較高,原先採用的阿里雲9.9元服務器性能並不足以完整地載入模型進行運算。
  • alpha版本的軟件是針對安卓4.4進行編寫的,在權限的處理上存在不足,沒有動態申請權限。在安卓6.0及以上的手機上運行會出現沒有權限的問題。
  • 在子界面的返回操做處理上,細節處理的不夠好。不符合安卓用戶慣用的經過「返回鍵」返回上一級界面的方式。

其餘

  • 沒有規範的技術文檔,致使開發很混亂,會出現某個功能完成後接入主程序的時候出現問題。
  • 沒有強制性的deadline,許多工做常常沒能按時完成。

咱們已經作了哪些調整/改進

算法組

  • 考慮到採集到的數據量小,按9:1分配給訓練集和測試集。這樣就可以提高模型效果。
  • 嘗試拋棄CRNN文字識別模塊,啓用YOLO中被刪除的詞樹模塊來CRNN,由文字識別轉爲對現有數據集按商店名進行分類。且在數據集中添加含有摩爾紋和障礙物以及不一樣光線條件下的數據集,增長算法的魯棒性。

開發組

  • 使用筆記本電腦搭建本地服務器。
  • 現階段主要採用手動在系統設置裏賦予軟件軟線的方式。
  • 現階段主要是採用相似蘋果的用過左上角按鈕返回的方式。

其餘

  • 咱們查詢了相關文檔,瞭解如何寫技術文檔。
  • 未能按時提交的同窗請喝奶茶(๑¯ิε ¯ิ๑)

咱們在接下來的Beta衝刺中會有哪些改進

算法組

  • 多拍照片,擴大數據集。
  • 基於神經風格遷移、平移、選擇、高斯噪聲等一系列數據加強的手段在數據集擴充上起到了較佳的效果,可是天然場景下的中文識別的泛化性問題還是當今難以解決的難題之一,咱們計劃以目標檢測來代替文字識別,經過直接對商鋪招牌進行檢測,來儘量避免文字識別模塊帶來的精度偏差。

開發組

  • 若是有柯老闆的天使投資,能夠嘗試購買更好的雲服務器。不然的話應該仍是繼續使用本地電腦做爲服務器。
  • 後期將使用動態申請權限的方式,並給用戶友好的提示。
  • 後期將加上經過虛擬或者物理按鍵返回的方式。

其餘

  • 若是時間上容許,咱們會試着寫咱們本身的技術文檔。
  • 未能按時提交任務的同窗要扣貢獻度!
相關文章
相關標籤/搜索