Form-OCR & CSDNAPP初體驗

項目 內容
課程:北航2020春軟件工程 博客園班級博客
做業:閱讀並撰寫博客回答問題 軟件案例分析
我在這個課程的目標是 全面地評價一個軟件
這個做業在哪一個具體方面幫助我實現目標 明確軟件開發過程當中哪些方面須要注意

選擇產品

選擇的待分析產品:html

CSDN APP前端

智能表單信息抽取識別react

第一部分:調研,評測

CSDN APP體驗

我在ios13系統的iphone7上,打開了CSDN的app。首先就能夠看到,其界面是相對簡潔的;首頁的主要瀏覽內容是熱門的帖子和博客,涵蓋了技術、生活、感想、新聞等與IT行業緊密相關的各個方面。同時還有「學習」欄目能夠加入付費的課程,「Blink」欄目能夠關注大V們的動態……linux

我嘗試着閱讀首頁的一些文章,使用了十幾分鍾後,產生了如下幾點感覺:ios

  • 功能:app並非遇到問題後,快捷的查找解決辦法的工具;而適合閒來無事的時候,在瑣碎的時間裏翻閱文章,長見識,作一些知識儲備,更具生活性
  • 界面:看文章中的代碼體驗很難受,豎屏時屏幕寬度只有十幾個字符,橫屏時屏幕高度也受到限制,並且文本過小費眼睛。相比電腦,這點確實是手機的先天不足,沒法彌補
  • 界面:文章最下端有很是多的類似文章的連接,致使要跳到文章末尾時十分不便,可能從屏幕最下端要往上拉好幾個屏幕才能看到文章末尾的位置
  • 界面:APP動畫比較流暢,查看文章時體驗尚可,按鈕設計不易誤觸
  • 數據量:圖中能夠看到,除了文章標題以外,下面有文章大約50字的節選能夠帶咱們一窺文章內容。可是像圖中《生成隨機數的方式你選對了嗎》這樣一篇文章,其摘要部分竟然是版權而不是對標題的解釋,實屬無效信息。我認爲每篇文章發表前均可以增長一個大約50字的摘要,由做者填寫,展現時附在文章標題下,以便遊客瞭解文章大體內容。

在使用的過程當中,我還發現了一些小bug:git

  1. 切換到「個人」(見上圖右下角)視圖時,頁面位置並不會自動定位到頁面最上方,而是定位在一個偏中下的位置,而遮擋了頭像等關鍵我的信息。若是我想要登陸,還須要手動把屏幕往上拉。我的懷疑是由於軟件在不一樣的手機上的適配狀況不一樣致使的。程序員

  2. 翻看評論時不能經過左滑退出,只能經過往下滑和點擊X按鈕退出評論區。若是看完最後一條評論時候,就必須往回滑動到全部評論的頂端以後再下滑以退出評論區;或者點擊左上角的X按鈕(但其實單手使用的時候按鈕仍是比較遠的)。github

CSDN APP打分

類別 描述 評分 (滿分 10 分, 良好 6 分, 及格 4 分,聊勝於無 1 分, 不好 -3 分)
功能 核心功能 分析三個核心功能,功能設計和質量。 9
細節 有什麼爲用戶考慮的細節? 6
用戶體驗 當用戶完成功能時,不干擾用戶 (例如: 是否不斷彈出不相關廣告)。 10
輔助功能 一些輔助功能如皮膚等 4
差別化功能 這個軟件獨特的功能. 它對用戶的吸引力有多大? 7
軟件的效能 佔用內存, 啓動速度, 內存泄漏狀況 9
體驗 軟件的適應性 在聯網/斷網, 大小屏幕, 沒有鼠標的狀況下均可以順暢操做. 和不一樣平臺的軟件能流暢協做 9
成長性 記住用戶的選擇, 適應用戶的特色,用戶越用越方便 使用時間不夠長,缺少體驗
用戶有控制權 系統狀態有反饋,等待時間要合適。關鍵操做有確認提示,有明確的錯誤信息。 6

若是想要經過app查閱資料的話,效率並非很高,可是若是想要經過app來作知識儲備,拓寬技術視野,瞭解一些行業前景和故事的話,相信app仍是可以很好的知足要求,尤爲特別適合碼農上下班擠地鐵的時候看。web

OCR體驗

Microsoft這個OCR-Form-Tools主要是用於識別表單中的信息,好比一張收據中的客戶名、交易額、交易時間、卡號等等信息,前端在React-Redux框架下采用了Typescript編寫。面試

搭建好環境以後,根據老師提供的數據庫地址(Azure blob container)和表單識別模型服務(Form Recognizer service),本地的WEB前端鏈接上了遠端的數據服務器。

在運行以前,首先須要標記一些訓練集

能夠看到咱們將一張收據中的有關信息用不一樣顏色的框將其框起,而且賦予不一樣的標籤Tag,好比客戶名Name、客戶郵箱Email、客戶地址Address、交易額Amount等等。

在這個頁面,首先咱們須要點擊右邊的綠色Train按鈕,讓遠端的模型加載上一頁咱們所標註的標籤Tag進行訓練。訓練後咱們獲得一個ID爲fdf40fdd-e809-4967-b1ee-763ca13507db的模型,以及該模型在訓練集上的表現(此時咱們能夠看到它對於訓練集的擬合程度是100%,可以識別出全部的標籤)

Result頁面咱們能夠上傳一張本身的pdf文件,點擊預測Predict白色按鈕,咱們剛剛訓練好的模型將會對上傳的pdf進行分析,而且返回給咱們這張收據裏面可以識別出的全部內容,好比客戶名Name爲Jamie Gonzales,客戶的郵箱爲jaimeg@outlook.com,客戶的卡號Card Number爲4867977021872331……

總的來講,程序的運行效果仍是不錯的,對於給定格式的pdf收據文件,可以不少好的分析出大部分的信息,很是有利於企業對交易進行自動化系統化的管理。

可是使用過程當中,有幾點缺點,仍然可以讓用戶感覺到軟件的開發還沒有完成:

  • 使用卡頓,標註訓練集的標籤tag的時候,大約有1-2s的卡頓,彷佛是由於每個標註的操做都當即與服務器同步?個人建議是,讓標註做爲本地的功能而不是一舉一動都傳服務器。好比設計一個「標註狀態」專用於標註,在用戶標註完以後,能夠退出該狀態,而後再統一將全部的操做都上傳。

  • 用戶暫時沒有辦法上傳本身的數據集。因爲沒有開放Azure blob container倉庫,前端也沒有提供響應的接口,用戶沒有辦法使用本身的收據格式。建議添加這樣一個接口和相應的文件管理功能,可以按類別分類收據,甚至能夠訓練模型對收據進行自動的分類。

  • 模型的識別率有提升的空間,好比上圖日期Date的數據,就很明顯出現了異常:出現了12/11 11/20 20這樣的重複識別的問題。

  • 沒有對不一樣模型的管理功能。咱們訓練的模型彷佛都是一次性的?

  • 導出json格式的時候,在個人環境下(archlinux x64, npm 6.14.3)必然會出現error

OCR打分

類別 描述 評分 (滿分 10 分, 良好 6 分, 及格 4 分,聊勝於無 1 分, 不好 -3 分)
功能 核心功能 分析三個核心功能,功能設計和質量。 8
細節 有什麼爲用戶考慮的細節? 6
用戶體驗 當用戶完成功能時,不干擾用戶 (例如: 是否不斷彈出不相關廣告)。 9
輔助功能 一些輔助功能如皮膚等 6
差別化功能 這個軟件獨特的功能. 它對用戶的吸引力有多大? 8
軟件的效能 佔用內存, 啓動速度, 內存泄漏狀況 6
體驗 軟件的適應性 在聯網/斷網, 大小屏幕, 沒有鼠標的狀況下均可以順暢操做. 和不一樣平臺的軟件能流暢協做 9
成長性 記住用戶的選擇, 適應用戶的特色,用戶越用越方便 4
用戶有控制權 系統狀態有反饋,等待時間要合適。關鍵操做有確認提示,有明確的錯誤信息。 4

雖然OCR的評分看起來並非那麼好,那是由於本人以一個完整的企業軟件做爲標準來看待這款開發中的軟件,確實吹毛求疵了點,不過也許能說明軟件的一些不足之處吧。

第二部分:分析

使用此服務的全部功能,估計這個軟件/網站/服務作到這個程度大約須要多少時間(團隊人數6人左右,計算機大學畢業生,並有專業UI支持)。

  • CSDN APP

    若是是一個雄心勃勃的創業團隊,團隊成員6人都有激情有動力去作好這件事情,我估計大約須要6個月開發測試而且最終上線。其中基本功能的開發分爲大約3周的需求分析、架構設計,6周主要開發和3周測試。增量開發同理須要3個月。

  • Form-OCR

    本人的馮如杯項目和這個項目有幾分類似之處。都是採用typescript的react-redux開發前端,使用某種後端框架運行模型,對圖片(或者pdf)進行分析。個人馮如杯項目在4個懶惰的程序員的工做下,開發時間大約爲2個月;考慮到熟練的6人團體的的話,前端開發能夠1個月內完成(不知道Form-OCR用什麼模型來分析表單,因此不清楚後端開發的時間);同時前端若是採用React Hook等「偷懶」方式的話,效率應該還會更好一些。

分析這個軟件目前的優劣(和相似軟件相比),這個產品的質量在同類產品中估計名列第幾

  • CSDN APP

    SegmentFault(思否)彷佛web開發(包括前端後端集羣等)的博文會比較多一些,其界面功能也更加簡單簡潔,比CSDN少了「朋友圈」、「打卡」,「任務」,「活動」等功能,多了問答的功能。技術色彩更強。

    itpub技術論壇的功能和CSDN相似,可是因爲起步晚,其用戶量和知名度明顯不如CSDN。

    開源中國開源軟件更加多一些,論壇偏向於開源軟件的使用和修改。

  • Form-OCR

    暫時沒有找到表單識別平臺的相關工做

第三部分:建議和規劃

首先,市場有多大?潛在的用戶有多少?

  • CSDN APP

    IT行業市場之大,毋庸置疑。相信你們曾經或多或少都有在百度上查找一個bug緣由的經歷,排在最前面的很大機率就是CSDN上面的博客。做爲中國最大的IT技術社區,CSDN的用戶受衆從小白到從業者再到研發者,受衆現在已達千萬人(參考:2017年IT行業從業人員已達1950萬人)。

    那麼APP呢?其實我認爲,APP的潛在用戶要遠遠小於這個數字。主要緣由仍是據我對身邊人的觀察,CSDN這樣的技術社區大部分時間仍是用來求助的:遇到問題時候,找到他人的解決辦法;記錄本身曾經犯下的錯,幫助遇到一樣問題的他人。若是不是真的熱愛,並非全部人都願意長時間看他人帖子學習知識的。

  • Form-OCR

    市場一樣也是至關的大。尤爲對於每一個公司的財務、對於銀行前臺,這絕對是一個福音。財務須要管理收據、銀行前臺須要錄入客戶的材料,乃至一切和收據、文件材料、銀行水單等等有關的場景。預估潛在用戶可達百萬。

目前市場上有什麼樣的產品了,它們的優點劣勢在哪裏?和它直接競爭的產品在那裏?

  • CSDN APP

    目前app store上,有CSDN、奇點日報、開源中國、SegmentFault這幾個技術社區的app。我認爲,CSDN最大的優點,也是其餘產品難以望其項背的優勢,就是其資源的豐富。足夠開放、用戶足夠龐大、內容足夠豐富,天然有更強大吸引力。

    我認爲CSDN的劣勢,也是它長期被人詬病的兩點,是資源強制收費和抄襲現象氾濫。資源強制收費讓不少想開源的玩家沒有辦法免費共享本身的資源;抄襲現象則說明了隨着高手更加傾向國外的論壇,國內CSDN中技術水平通常的「伸手黨」佔比愈來愈大,博文質量愈來愈低。

  • Form-OCR

    暫時沒有找到表單識別平臺的相關工做

做爲新的項目經理,這個產品的核心用戶羣是什麼樣的人,典型用戶長什麼樣?學歷,年齡,專業,愛好,收入,表面需求,潛在需求都是什麼?

CSDN APP的核心用戶羣應該是IT行業的技術愛好者和從業者。典型用戶應該分爲如下幾種:

  • 有一線經驗的:

    • 樂於分享本身在技術上曾經遇到的問題,而且寫成博客做爲記念,並幫助行業的後來者
    • 應該是25-35歲之間,平時樂於鑽研,而且在某個領域從業了足夠長的時間,有本身思想風格
    • 表面需求是記錄本身的實踐經驗並幫助他人;潛在需求是想讓本身的文章被更多人看到,幫助更多人、獲得更多的讚揚
  • 懂得行業規則的:

    • 30-50歲,應該曾經擔任過HR、PM之類的職務,是管理型的人才
    • 樂於總結本身面試他人和管理時獲得的經驗,幫助行業人才發揮他們的才能
    • 表面需求是分享經驗,幫助他人;潛在需求是讓本身經驗獲得更普遍的分享
  • 熱愛IT行業的

    • 20-30歲,緊跟時代潮流、樂於鑽研的人,喜歡研究新技術學習新知識
    • 在CSDN的平臺中,查找資料、學習知識、記錄實踐
    • 表面需求是利用博客幫助本身理解一個技術,提高自我;潛在需求是擁有更加直接系統的教程和帶頭人
  • 遇到困難的

    • 年齡不限
    • 表面需求是找到答案,解決問題,以繼續本身的工做;潛在需求是但願解決方法找的快一點。
  • 想找答案的

    • 年齡不限
    • 表面需求是找到答案,完成任務;潛在需求是增長學習過程當中的知足感,激發主動學習的熱情。

Form-OCR的核心用戶羣應該是長期和表單打交道的人

  • 前臺

    前臺常常須要使用各類表單,銀行前臺管理客戶交易請求、酒店前臺登記顧客信息等

  • 醫院

    能夠很方便的讀取和解析醫院的報告單

  • 倉庫

    能夠便利的讀取倉庫的收據、貨款記錄,轉化成電子信息便於整理和處理

  • 企業財務處

    企業的單據、發票等能夠自動化地讀取,轉化爲電子信息存儲

  • 快遞

    快遞員在面對手寫的快遞單時,不再用人工錄入了快遞信息了

相關文章
相關標籤/搜索