圖像處理,計算機視覺和人工智能之間的差別

圖像處理,計算機視覺和人工智能之間的差別git

https://medium.com/@pallawi.ds/difference-between-image-processing-computer-vision-and-artificial-intelligence-af670d65055dgithub

做者:Pallawi算法

圖像處理和計算機視覺是超級興奮的研究和研究領域。隨着人工智能的進步,這兩個領域都在不斷髮展。後端

爲任何AI產品命名,你會發現計算機視覺在製造每一個智能系統中起着重要做用。我已經提供了一些使人驚訝的連接,能夠在本博客的最後使用該應用程序,你能夠本身嘗試並體驗這些顛覆性技術如何改變世界先後的工做方式。app

所以,在本博客中,我將幫助你瞭解圖像處理,計算機視覺和人工智能之間的區別。機器學習

我提出了一個有趣的狀況,這將有助於你很是輕鬆地理解全部這三個主題。函數

「因此,在假期你決定點擊你的兩隻寵物狗的照片」Shimmy「和」Pluto「訓練,在你美麗的花園裏進行一場比賽。 「Shimmy」必須在拿球后走左路,「冥王星」應該走正確的路線。「學習

圖像處理測試

你點擊了數百張照片,很快就完成了拍攝照片,如今你但願在社交媒體上上傳完美的照片。 但在發佈圖像以前,你但願圖像看起來更周到,而且你還但願告訴你的朋友,圖像是在週日早上7點拍攝的,並在圖像上打印出可愛的寵物名稱做爲主題標籤。人工智能

要完成上述全部操做,你決定經過圖像編輯移動應用程序傳遞圖像,該應用程序在後端運行多個功能,並在每一個功能中運行圖像處理算法,該算法將你的圖像做爲輸入對圖像執行數學運算,如在算法中並給出所需的輸出圖像。 以下圖所示,你能夠看到從新分佈的色調級別(伽馬校訂),輸出圖像和嵌入其中的文本。

[1]: 左圖像是輸入圖像,右圖像是處理圖像

這是個人圖像處理代碼的連接,它很容易和有趣的嘗試本身。

https://github.com/PallawiSinghal/AIStarter/blob/master/imageprocessing.ipynb

計算機視覺

如今,你但願獎勵你的寵物「Shimmy」和「Pluto」做爲獲勝者和亞軍,根據誰在他們的嘴裏抓住紅蘋果或黃色圓盤的最大次數並將它們返回給你在他們各自的軌道上移動 ,左邊是「Shimmy」,右邊是「Pluto」(遊戲規則)。

你能夠經過查看上面的圖像來輕鬆決定Shimmy是贏家,但若是你天天玩50次遊戲並且每週玩7天,該怎麼辦?

而後經過查看圖像決定誰是勝者,如今數量已增長到每週350張圖像變成一項艱鉅的任務。

因此,如今你必須創建一個計算機視覺系統來自動化你的工做。

所以,CV(計算機視覺)系統的第一步應該對350的每一個圖像進行詳細分析。

分析階段

這項分析的目的是找到一個通用的解決方案,不只僅是幾百個圖像,而是多年來的許多圖像。

咱們在圖像中必須尋找的是大多數時候寵物如何出如今圖像中的模式。就像這裏「Shimmy」在左側軌道,「Pluto」在右側。

此外,深刻分析圖像質量,如圖像中局部和全局噪聲的數量,對比度加強的要求和邊緣保存。在圖像中須要和容易分割。此外,哪些圖像的特徵是提取以找到帶球的寵物,其能夠是球的形狀或狗的顏色。

如今計算機視覺主要是兩個主要的事情,分析和圖像處理算法,你選擇聯合起來得出這樣的結論,誰是兩個寵物中的勝利者。

圖像處理算法在對大量數據進行詳細分析後智能地進行分組,以給出正確的結果,例如每隻寵物抓住球的次數,玩家公平,什麼時候以及爲何寵物未能接球,最大或最小高度若是給定任何輸入圖像定義計算機視覺系統,則捕獲球。它是關於歸納或提供結合許多圖像處理算法的可擴展解決方案。

因爲圖像處理輔助計算機視覺從圖像中獲取更有意義的信息,所以它還使開發人員的分析質量極其獨立,負責開發通用解決方案,以便經過CV系統得到較不類似的測試圖像的準確輸出。

在下面的圖像中,你能夠看到我發現「Shimmy」有黃色磁盤。我經過執行圖像分割,輪廓搜索,凸包檢測,多邊形逼近,將多邊形映射到空白圖像並最終使用模板匹配檢測黃色磁盤來完成此操做。

[2]: 左圖是輸入圖像,中間圖像是掩模(若是你不斷看圖像一段時間你能夠找到從中心到角的強度差別),右圖是背景圖像(這個背景) 使用很是著名的OpenCV函數「Grabcut」完成刪除(前景和背景分割)。

[3]: 第一個圖像是上面最右邊圖像的模糊圖像,這裏使用的模糊像處理算法,用於邊緣保存和噪聲消除。 第二幅圖像是灰度圖像。 第三圖像是閾值圖像,也稱爲二值圖像。 第四個圖像是第三個圖像的輪廓圖像(簡單地說,咱們試圖在全部顏色爲白色的物體上繪製邊界,其中也包括寵物),在最後一個圖像中,咱們經過周長逼近最大輪廓使用凸包,這裏最大的輪廓將是寵物的輪廓,並在圖像上繪製近似的形狀,多邊形。

[4]: 左圖像是該步驟的輸入圖像,咱們製做近似的小掩模(中心圖像)以將寵物多邊形轉移(也稱爲翹曲,wrapping)到小圖像(中心圖像)上。 翹曲後的結果看起來像右圖

[5]: 左圖是這裏的輸入,咱們使用黃色光盤的小模板圖像在此圖像上進行模板匹配,以下圖所示。 模板匹配是一種算法,模板圖像從輸入圖像的頂部到底部移動,輸入圖像是咱們狀況下最左邊的圖像,並在輸入圖像中找到最佳匹配部分。 模板匹配的輸出將是中心圖像,由於你能夠看到圖像中最亮和閃亮的部分是黃色光盤所在的位置。 所以,咱們在最右邊的圖像上繪製一個框。

[6]: 模板圖片

我很是確定,若是你是初學者,你必須查找一下上面充滿那些沒有聽過的詞。 但請相信我,這是一個從分析到算法設計的很是有趣和創造性的旅程。

這是個人GitHub賬戶的連接,你能夠在其中找到計算機視覺系統的代碼,該系統能夠找到誰有球。 我將在即將發佈的博客中撰寫關於全部部分的詳細博客,並提供連接。 但若是您如今有任何疑問,請隨時在評論部分詢問我。

Here is the link to my code for Computer Vision, it is easy and intresting to try on your own.

https://github.com/PallawiSinghal/AIStarter/blob/master/computervision.ipynb

人工智能

若是你選擇硬閾值來檢測「Shimmy」,「Pluto」或黃色循環,例如應用半自動分割(OpenCV grab cut),模板匹配,決定寵物應移動的軌道,則此設計的系統可能缺少可擴展性或寵物身體的顏色閾值。你最終可能會建立一個只能識別「Shimmy」和「Pluto」的偏見系統。

你將沒法將你的CV系統交給世界,以便在不一樣的狗或貓身上獲得相同的結果,由於規則和特徵只偏向於「Shimmy」和「Pluto」。

人工智能「救世主」提供圖像處理,計算機視覺算法和機器學習算法,以幫助你像魔術同樣推廣系統。

它是一個像咱們的大腦這樣的系統,它經過不斷地查看周圍的事物來智能,合理和準確地採起它所學習的任何決策,這只不過是數據,而且經過隨時間學習的反饋和經驗來更新所得到的知識。

就像你在教育系統中長大的學習同樣,你的老師教你用圖像來區分世俗的東西,給你的大腦喂兩個輸入,一個是圖像,第二個是正確的特徵描述,它的外觀和位置在圖片。

一樣,若是咱們想爲上述類比構建一個AI系統,咱們須要使用圖像處理算法提供預處理的圖像,並告訴他們你想要檢測的球,磁盤,蘋果,狗或任何東西的位置並存在於圖像中。

而後,一旦圖像和圖像的內容,信息被提供給系統,計算機視覺就會出如今圖片中。

AI由多層組成,就像一包麪包同樣,每層運行一個計算機視覺算法,其工做是從圖像中提取特徵。

在前幾層中,咱們提取圖像上的直線或曲線邊緣等低級特徵,而後在它學習檢測眼睛,蘋果,爪子,尾巴以及後來完成的每層中提取全部提取的特徵。狗或貓。稍後您將使用這些學習過濾器來預測新數據集上的對象,該數據集也稱爲測試數據集。

[7]: 以上圖片由https://www.cc.gatech.edu/~hays/compvision/proj6/提供,能夠在此處查看圖層的外觀以及每層的特徵提取方式。

固然有數學方程式。 可是,讓我向你保證,他們很容易,你能夠作到。

而且全部的學習都保存在模型中,就像咱們的學習保存在咱們的大腦中同樣,它是通用的,能夠用於任何其餘數據。

構建AI解決方案的一個很是關鍵的輸入是數據。 想象一下,你須要付出的努力才能創造出一個狗在世界各地玩球的數據集(沒有差錯的數據集)。

所以,總結三個方面的圖像處理,計算機視覺和機器學習造成了一我的工智能系統,你能夠在其周圍聽到,看到和體驗。

總結

我試圖解決一個很是簡單但很是重要的話題,這個領域的每一個初學者都想要理解。 當我開始學習這個領域時,我老是有這個問題,並且我發現不多有人明確地回答個人問題。 我但願我能幫到你。 我強烈建議你爲每一個部分運行個人代碼。 它很是簡單,有助於在你對這些普遍主題的想法中創建清晰度。

相關文章
相關標籤/搜索