OCR-Form-Tools是微軟的一個開源代碼庫,包含微軟表單識別和OCR服務相關的多種工具。Github倉庫地址前端
目前,表單標註工具(OCR Form Labeling Tool)是首個發佈到本該倉庫的工具。這篇博客記錄了我嘗試在本地部署並運行該工具的過程。node
官方提供了已經構築好的docker鏡像,若是本地配置了docker環境能夠直接拉取並使用。這裏參考官方文檔react
配置docker環境的方法能夠參考docker官網linux
# pull image docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool # run image docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool eula=accept
訪問本地3000端口便可看到頁面。git
須要注意,對於windows/macosx下使用Docker Toolbox的狀況,docker運行在虛擬機上,因此須要訪問虛擬機的3000端口才能看到頁面(好比個人是http://192.168.99.100:3000/)。使用新版的docker desktop則沒有這個問題github
代碼在手,直接編譯並運行這個項目也是可行的。考慮到這個工具的主體是一個react前端應用,咱們須要藉助npm等工具完成編譯。docker
這個項目使用npm進行依賴管理,所以咱們首先須要安裝npm。macos
windows用戶能夠從nodejs中文網下載。安裝軟件會自動完成環境變量配置等工做,直接按提示一路到底便可。npm
對於linux用戶直接使用apt安裝便可windows
sudo apt install nodejs npm -y
安裝完畢後檢查
node -v npm -v
這裏個人node版本是v10.16.0,npm版本是6.9.0,根據項目文檔,node版本最好>=10.0,若是已經安裝了更低版本的node能夠考慮升級
國內訪問npm自帶的官方軟件源通常較慢,難如下載依賴,所以咱們能夠將源換爲國內源。
一個國內經常使用的開源鏡像是淘寶NPM鏡像
換源方法能夠參考這篇博客:http://www.javashuo.com/article/p-qavzncqn-me.html
編譯的工做參照倉庫README說明便可。拉取代碼
git clone https://github.com/microsoft/OCR-Form-Tools.git cd OCR-Form-Tools
安裝依賴。這一步時間較長,能夠先去喝杯咖啡
npm install
編譯並打包
npm run build
最後運行便可,若是成功會自動彈出瀏覽器並訪問本地3000端口。
npm run react-start