軟件工程基礎 微軟OCR-Form-Tools體驗

一點說明

這篇博客是軟件工程基礎(羅傑、任建)的第三次課程做業(我的項目做業)html

項目 內容
這個做業屬於哪一個課程 軟件工程基礎(羅傑,任建)
這個做業的要求在哪裏 做業要求的連接
我在這個課程的目標是 提高對軟件工程的宏觀和微觀的全面認識,並加以實踐
做業在哪些方面幫我實現目標 當了一把體驗官!
個人教學班級 006

調研、評測

1. 下載與安裝

2. 基本功能體驗

使用10–30分鐘這個軟件的基本功能(請上傳使用軟件的照片web

在博客 OCR-Form-Tools項目試玩記錄(二)產品評測 中,Mis Tariano詳細介紹了軟件的完整運行流程,我就再也不贅述了,這裏僅分享一下本人的一些功能體驗。瀏覽器

img
Tag標記
img
模型訓練
img
模型測試
img
數據導出

3. 直擊痛點?

解決了用戶的問題麼?軟件在數據量/界面/功能/準確度上各有什麼優缺點?用戶體驗方面有問題麼?工具

  • 直擊痛點:自主的Tag選擇與訓練、手寫體的良好識別、Json格式的導出,我相信是目前爲止PDF表單處理的最好解決方案之一;學習

  • 數據量:鄒欣老師給出的示例中,僅用5例訓練就能夠獲得較好的模型,很是nice;測試

  • 界面:微軟家軟件近幾年來一向的扁平風,溫馨簡約又不失設計感,整個流程體驗下來很是絲滑;大數據

  • 準確度:在我有限的測試中,除去一些小的數字重複的BUG(詳見下文),沒有發現其餘的正確性問題,其對於表格中各項內容的識別擁有極細的顆粒度,沒有出現其餘OCR工具常出現的詞語粘連的問題;網站

4. BUG在哪裏

下載, 部署並體驗軟件的功能,按照描述的bug定義,找出至少2個功能性bug。用專業的語言描述(每一個bug很多於40字),若有必要,能夠配圖。.net

  • 功能性BUG設計

    • (Chrome瀏覽器)在 Tags Editor界面,使用 F11 快捷鍵進行全屏顯示時,會彈出 「Type Error」的提示框。將提示框關閉後,發現其實能夠正常全屏顯示。(屢次嘗試,可復現)

      img
      使用F11快捷鍵,彈出錯誤提示
      img
      點擊OK後,發現界面其實成功地全屏顯示
    • 側邊瀏覽區域不能拖拽縮放,可是有拖拽提示

      img
      當鼠標放置在邊框處,會變成拖拽樣式,可是根本沒法對邊框進行拖拽縮放
    • 對於number類型,偶爾出現的重複問題,這個重複彷佛是隨機的

      img
      tag標註時,能夠看到,日期的部分數字出現了重複
      img
      對訓練出來的模型進行測試時,日期一樣出現了重複
  • 廣義的BUG(若是非得找出幾個的話……)

    • 邏輯問題:鼠標放在Tag上,會顯示出Tag的名字,這……原本就能夠看到Tag的名字呀!我認爲這裏應該顯示出更加有用的信息。

      img
      建議這裏彈出有用的信息,如Tag的類型等
    • 縮放問題:在編輯窗口,鼠標滾輪滾動一下縮放的比例與點擊一下縮放按鈕縮放的比例不一樣,前者是後者的3倍。這使得最便捷的鼠標滾輪縮放的跳動太大,變得不是很方便。

    • 仍是縮放問題:不管我怎麼調整,文檔都沒法恰好填滿編輯窗口……(強迫症患者退出直播間)

      img
      反覆試探,都沒法完美填滿編輯窗口 :(

5. 結論(評價與意見)

總的來看,我給這個工具的評價爲 「很是推薦」。

分析

1. 開發時間估計

使用此服務的全部功能,估計這個軟件/網站/服務作到這個程度大約須要多少時間(團隊人數6人左右,計算機專業的大學畢業生,並有專業UI支持)。

將一個項目打磨到如今這麼精良,雖然功能專注,可是能夠看出整個操做流程的細心考量,我估計須要2個月左右的時間。

2. 宇宙第一OCR?

分析這個軟件目前的優劣(和相似軟件相比),這個產品的質量在同類產品中估計名列第幾?

相似的軟件大都是面向企業用戶的,如智慧雲識-智能表單識別,我沒法得到使用權限,因此就拿這個工具與我作筆記時經常用到的天若OCR比較一下:

  • 微軟OCR部署在網站上,是經過網頁進行交互的,而天若OCR有客戶端,能夠經過快捷鍵隨時呼出,即時地進行識別;

  • 微軟OCR是開源項目,無償使用;天若OCR的商用是須要收費的,而我的用戶要使用表格分列等功能則須要充值VIP;

  • 微軟OCR目前的功能專注而強大,專一於PDF表單的識別;天若OCR支持更多的格式如圖片,可是其識別出來的信息缺少規範;

    img
    天若OCR的表單功能須要充值,往後必定補上 :)

3. 冷靜分析.jpg

你在第一部分發現的bug,爲什麼軟件團隊不能在發佈前修復?他們是不知道,仍是有意不修復?你以爲是什麼緣由?

我發現的都是一些小Bug,並且大都屬於見仁見智的問題吧,我猜想是由於對該工具的定位不一樣,做爲核心用戶爲企業而非我的的開源項目,這些小瑕疵是很容易被忽略的。

建議、規劃

1. 市場分析

市場有多大?潛在的用戶有多少?

每一個公司或政府單位都要有財務,都要有各類報表、考勤表等等表格的處理,在大數據時代,將紙質數據信息化已經成了必然趨勢。傳統的效率低、易出錯、成本高的人工數據錄入方式必然被時代所淘汰,當各類表格「上網」之後,對於這些表格的進一步處理就成了亟待有效解決的問題。仍是那句話,我認爲微軟表單OCR是當前最好的解決方案之一,市場空間巨大。

2. 用戶分析

做爲新的項目經理,這個產品的核心用戶羣是什麼樣的人,典型用戶長什麼樣?學歷,年齡,專業,愛好,收入,表面需求,潛在需求都是什麼?

本開源項目的核心用戶羣應該是公司或事業單位,主要用於商業用途並且我的使用,整個使用邏輯都是爲商業使用行方便的,好比項目徹底上Azure雲(應該也有基於扶持微軟自家雲服務的考量),我的使用起來是很是麻煩的。那麼對於商業用於來講,他們的潛在需求就是更高的性價比了,或許學習成本並不十分重要。

3. 新的功能

功能:你要設計什麼樣的功能?爲什麼要作這個功能,而不是其餘功能?爲何用戶會用你的產品/功能?你的創新在哪裏?

我認爲該開源項目切中了大量表單數據處理的痛點,擁有強大的深度學習內核,若是再擁有更加「傻瓜」的操做邏輯,必定會成爲新的爆款應用。

  • Excel導出:其實這個功能能夠很是簡單地實現,畢竟即便將Json格式的數據導入Excel進行人工規範也是很是輕鬆的。可是若是有直接導出爲Excel的功能,我想會讓該工具適用更普遍的用戶和使用環境,如今的使用門檻仍是有一些高的;
  • 自動生成Tag:這個實際上是「錦上添花」的功能吧,若是添加該功能,必須保證極高的正確性,不然自動生成所節約的時間所有又浪費在Tag的糾正上去了。

寫在最後

第一次作一個軟件的體驗與測評,十分忐忑,寫完之後,不由長舒了一口氣……若有(必定有)紕漏,望指正。

相關文章
相關標籤/搜索