姓名前端 |
學號python |
楊浩政(組長)git |
3116004705算法 |
謝創敏網絡 |
3116004478架構 |
鍾偉機器學習 |
3116004711函數 |
李奕柱學習 |
3116004691測試 |
李曉陽 | 3116004641 |
肖潔鑾(小小) | 3216004492 |
文本圖像識別是機器視覺領域的重要研究課題之一。文本圖像識別涵蓋不少應用和任務,其中大部分起源於幾十年前的文檔數字化。利用原始圖像數據實現其分類、識別、檢索已經成爲信息處理領域極其重要的研究內容。用戶可以對圖像文檔進行更高層次的操做與理解,所以文本圖像識別技術獲得了愈來愈普遍的關注與應用。
(1)對不一樣類型驗單圖像的識別
圖像預處理能夠消除圖像中無關的信息,恢復有用的真實信息,加強有關信息的可檢測性和最大限度地簡化數據,從而改進特徵抽取、圖像分割、匹配和識別的可靠性。所以對驗單圖像的預處理算法的選擇尤其關鍵。以後經過對驗單圖像的特徵提取等操做,用神經網絡模型進行識別訓練,提升識別率。
(2)分類獲得驗單中數據有效區域的ROI部分
對ROI區域進行處理和分析不但能夠下降分析過程的複雜度,並且可以減小沒必要要的計算浪費,因爲每種驗單的數據區域已經固定,因此決定採用閾值分割算法中的全局閾值法以及canny算子等一些邊緣檢測算法提取ROI區域並進行圖像分割。
(3)對數據有效區域進行特徵提取以及識別
對數據有效區域文本信息的檢測的步驟通常爲定位圖像文本,將文本與背景分離最後進行識別並獲取文本信息,在文字檢測方面運用MSER算法和筆畫寬度變換算法對數據區域進行檢測,在文字識別方面使用卷積神經網絡AlexNet模型進行訓練並結合支持向量機的方法對樣本特徵進行分類。
(4)流程圖
基礎需求只須要提供接口給用戶由那邊調用接口來獲取檢測到的文字數據,但當驗單類型增長則須要後臺經過手動更新模型來知足驗單識別。另外一種比較有難度的方案即是提供給用戶一個圖形界面,能夠在圖形界面上添加新的驗單類型圖片,輸入標籤,並提供接口作到能夠在原模型的基礎上迭代新模型,使得整個系統更加自動化與方便化。
(1)真實性
本項目處理的圖像數據,來自於眼球檢驗設備的輸出驗單。
(2)可用性
本項目提供封裝好的接口供用戶使用,使其在輸入驗單圖片後可以獲取驗單有效數據區域的文本格式文件並繼續接下來對數據的操做。免去了醫療人員手工錄入的繁瑣操做,極大地提升了醫生的效率。
(2)價值性
眼球做爲人體生物特徵的一個重要組成部分,包含着豐富的可用信息,在近年來獲得了國內外研究者的高度重視和密切關注。同時眼球識別技術也獲得了迅速的發展。眼球識別能夠精確獲取眼部疾病患者雙眼信息,如眼球的位置區域、瞳孔中心、虹膜信息甚至視線方向等。而運用圖像處理與模式識別技術對眼球驗單以及數據區域進行識別,則能夠將信息進一步進行處理,提取出各種相應的數據,使診斷和治療過程更加自動化,節省了患者與醫生的時間,提升效率。
(1)項目採用碼雲管理平臺:項目地址
(2)擬定驗單識別量:因爲在初級階段,驗單數據集比較少,暫定20類驗單。
第6周 |
1.團隊組隊、團隊博客(✔) |
2.團隊介紹、成員展現、角色分配、選題肯定(✔) |
|
3.制定團隊計劃安排(✔) |
|
第7周 |
1.需求規格說明書 |
2.原型設計,隊員估計任務難度並學習必要的技術 |
|
3.編碼規範完成、平臺環境搭建完成、初步架構搭建 |
|
第8周 |
1.原型改進(給目標用戶展示原型,並進一步理解需求) |
2.架構設計,WBS, 團隊成員估計各自任務所需時間 |
|
3.測試計劃 |
|
第9周 |
1. 團隊項目Alpha任務分配計劃 |
2. 連續7天的Alpha敏捷衝刺,7 篇 每日Scrum Meeting博客+代碼提交 |
|
第10周 |
1.用戶反饋+測試計劃改進 |
2. 團隊Alpha階段我的總結 |
|
3. 團隊項目Alpha博客:發佈說明、測試報告、展現博客、項目管理 |
|
第11周 |
1. 團隊項目Alpha博客:過後分析 |
2. 每一個團隊有一人必須離開,本身尋找下一個接納本身的團隊。團隊發博客宣佈離隊和接納的成員。 |
|
第12周 |
1. 團隊項目Beta任務分配計劃,介紹新成員 |
2. 連續7天的Beta敏捷衝刺,7 篇 每日Scrum Meeting博客+代碼提交 |
|
第13周 |
1. 團隊項目Beta博客:發佈說明、測試報告、展現博客 |
2. 團隊Beta階段我的總結 |
|
第14周 |
1. 團隊項目Beta博客:過後分析, 宣佈每人的貢獻分 |
第15周 |
1.團隊整個階段總結,分析用戶數據,整理文檔,保證之後的團隊能接手。 |
因爲目前項目進展較爲順利,因此項目計劃表暫無變動。
隊員姓名 | 分工 |
---|---|
楊浩政 | 圖像識別與文字檢測算法方向總體把握,代碼整合與優化 |
鍾偉,謝創敏 | 嘗試並實現文字檢測的深度學習算法 |
李奕柱,李曉陽 | 驗單類型圖像識別代碼的實現與整合 |
肖潔鑾 | 協助後期實現用戶界面操做 |
楊浩政:之前總以爲拿到項目直接上手就能夠,直接思考代碼怎麼寫,如今發如今寫代碼以前有好多事情須要思考,尤爲如今是團隊合做,如何發揮團隊中每一個人的才能與積極性很重要,一樣重要的是關於整個項目的實現思路必定要多思考,怎樣能夠更快捷更方便,避免重複造輪子而寫出效果最好的代碼。
李曉陽:該項目以前就有接觸過了,不過由於以前就暑假只學了一點基礎知識,開學後也好久沒碰過,因此基本得從頭再學,如今仍是有不少不明白的地方,須要努力學習。但願能夠儘快上手,也但願項目進展順利。
鍾偉:第一次接觸這樣的團隊大項目,對於我我的來講都是很大的挑戰。通過你們的討論,目前有了基本的方向,我也在積極的儲備相應的知識。雖然有些知識挺難懂的,可是我相信花時間必定能夠有所領悟,慢慢的作出點功能,在這個過程當中,本身對python的掌握會不斷提升,經驗也會不斷豐富。
謝創敏:第一次接觸機器學習,發現機器學習沒有以前想象的複雜,但也不簡單。一邊學一邊實踐,愈加對機器學習產生了興趣。雖然學習過程當中遇到不少困難,但也鍛鍊了本身解決困難的能力。期待此次項目能夠帶給我更多的經驗和收穫。
李奕柱:團隊項目使用python+機器學習+opencv,我主要負責圖像處理方面模塊,雖然暑假對opencv有過一些瞭解,但目前還有許多問題不懂,也遇到了一些以目前我的水平難以解決的問題,接下來要好好深刻學習,爭取在期限內把項目完成。
肖潔鑾: 在此次的項目中,我主要負責前端頁面的編寫,在開發中,我深入體會到了溝通的重要性,並對某些理解不夠深刻的知識點進行總結,期待在這此項目中,可以突破一些技術難點,有更多的收穫。