人工智能：計算機視覺、圖像處理、模式識別、機器學習之間的關係

時間 2019-12-09

原文原文鏈接

人工智能：計算機視覺、圖像處理、模式識別、機器學習之間的關係html

什麼是人工智能呢？人工智能，是由人類設計並在計算機環境下實現的模擬或再現某些人智能行爲的技術。通常認爲，人類智能活動能夠分爲兩類：感知行爲與思惟活動。模擬感知行爲的人工智能研究的一些例子包括語音識別、話者識別等與人類的聽覺功能有關的「計算機聽覺」，物體三維表現的形狀知識、距離、速度感知等與人類視覺有關的「計算機視覺」，等等。模擬思惟活動的人工智能研究的例子包括符號推理、模糊推理、定理證實等與人類思惟有關的「計算機思惟」，等等。算法

人工智能領域：機器學習深度學習圖像算法圖像處理語音識別圖像識別算法研究數組

從圖像處理和模式識別發展起來的計算機視覺研究對象之一是如何利用二維投影圖像恢復三維景物世界。計算機視覺使用的理論方法主要是基於幾何、機率和運動學計算與三維重構的視覺計算理論，它的基礎包括射影幾何學、剛體運動力學、機率論與隨機過程、圖像處理、人工智能等理論。計算機視覺要達到的基本目的有如下幾個：機器學習

(1) 根據一幅或多幅二維投影圖像計算出觀察點到目標物體的距離；性能

(2) 根據一幅或多幅二維投影圖像計算出目標物體的運動參數；學習

(3) 根據一幅或多幅二維投影圖像計算出目標物體的表面物理特性；編碼

(4) 根據多幅二維投影圖像恢復出更大空間區域的投影圖像。人工智能

計算機視覺要達到的最終目的是實現利用計算機對於三維景物世界的理解，即實現人的視覺系統的某些功能。spa

在計算機視覺領域裏，醫學圖像分析、光學文字識別對模式識別的要求須要提到必定高度。又如模式識別中的預處理和特徵抽取環節應用圖像處理的技術；圖像處理中的圖像分析也應用模式識別的技術。在計算機視覺的大多數實際應用當中，計算機被預設爲解決特定的任務，然而基於機器學習的方法正日漸普及，一旦機器學習的研究進一步發展，將來「泛用型」的電腦視覺應用或許能夠成真。設計

人工智能所研究的一個主要問題是：如何讓系統具有「計劃」和「決策能力」？從而使之完成特定的技術動做（例如：移動一個機器人經過某種特定環境）。這一問題便與計算機視覺問題息息相關。在這裏，計算機視覺系統做爲一個感知器，爲決策提供信息。另一些研究方向包括模式識別和機器學習（這也隸屬於人工智能領域，但與計算機視覺有着重要聯繫），也由此，計算機視覺時常被看做人工智能與計算機科學的一個分支。

機器學習是研究計算機怎樣模擬或實現人類的學習行爲，以獲取新的知識或技能，從新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心，是使計算機具備智能的根本途徑，其應用遍佈人工智能的各個領域，它主要使用概括、綜合而不是演譯。

爲了達到計算機視覺的目的，有兩種技術途徑能夠考慮。第一種是仿生學方法，即從分析人類視覺的過程入手，利用大天然提供給咱們的最好參考系——人類視覺系統，創建起視覺過程的計算模型，而後用計算機系統實現之。第二種是工程方法，即脫離人類視覺系統框框的約束，利用一切可行和實用的技術手段實現視覺功能。此方法的通常作法是，將人類視覺系統做爲一個黑盒子對待，實現時只關心對於某種輸入，視覺系統將給出何種輸出。這兩種方法理論上都是可使用的，但面臨的困難是，人類視覺系統對應某種輸入的輸出究竟是什麼，這是沒法直接測得的。並且因爲人的智能活動是一個多功能系統綜合做用的結果，即便是獲得了一個輸入輸出對，也很難確定它是僅由當前的輸入視覺刺激所產生的響應，而不是一個與歷史狀態綜合做用的結果。

不難理解，計算機視覺的研究具備雙重意義。其一，是爲了知足人工智能應用的須要，即用計算機實現人工的視覺系統的須要。這些成果能夠安裝在計算機和各類機器上，使計算機和機器人可以具備「看」的能力。其二，視覺計算模型的研究結果反過來對於咱們進一步認識和研究人類視覺系統自己的機理，甚至人腦的機理，也一樣具備至關大的參考意義。

在個人理解裏，要實現計算機視覺必須有圖像處理的幫助，而圖像處理倚仗與模式識別的有效運用，而模式識別是人工智能領域的一個重要分支，人工智能與機器學習密不可分。縱觀一切關係，發現計算機視覺的應用服務於機器學習。各個環節缺一不可，相輔相成。

計算機視覺（computer vision），用計算機來模擬人的視覺機理獲取和處理信息的能力。就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺，並進一步作圖形處理，用電腦處理成爲更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺研究相關的理論和技術，試圖創建可以從圖像或者多維數據中獲取‘信息’的人工智能系統。計算機視覺的挑戰是要爲計算機和機器人開發具備與人類水平至關的視覺能力。機器視覺須要圖象信號，紋理和顏色建模，幾何處理和推理，以及物體建模。一個有能力的視覺系統應該把全部這些處理都緊密地集成在一塊兒。

圖像處理（image processing），用計算機對圖像進行分析，以達到所需結果的技術。又稱影像處理。基本內容圖像處理通常指數字圖像處理。數字圖像是指用數字攝像機、掃描儀等設備通過採樣和數字化獲得的一個大的二維數組，該數組的元素稱爲像素，其值爲一整數，稱爲灰度值。圖像處理技術的主要內容包括圖像壓縮，加強和復原，匹配、描述和識別3個部分。常見的處理有圖像數字化、圖像編碼、圖像加強、圖像復原、圖像分割和圖像分析等。圖像處理通常指數字圖像處理。

模式識別(Pattern Recognition)是指對錶徵事物或現象的各類形式的(數值的、文字的和邏輯關係的)信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。模式識別又常稱做模式分類，從處理問題的性質和解決問題的方法等角度，模式識別分爲有監督的分類（Supervised Classification）和無監督的分類(Unsupervised Classification)兩種。模式還可分紅抽象的和具體的兩種形式。前者如意識、思想、議論等,屬於概念識別研究的範疇,是人工智能的另外一研究分支。咱們所指的模式識別主要是對語音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號、生物傳感器等對象的具體模式進行辨識和分類。模式識別研究主要集中在兩方面,一是研究生物體(包括人)是如何感知對象的，屬於認識科學的範疇,二是在給定的任務下,如何用計算機實現模式識別的理論和方法。應用計算機對一組事件或過程進行辨識和分類，所識別的事件或過程能夠是文字、聲音、圖像等具體對象，也能夠是狀態、程度等抽象對象。這些對象與數字形式的信息相區別，稱爲模式信息。模式識別與統計學、心理學、語言學、計算機科學、生物學、控制論等都有關係。它與人工智能、圖像處理的研究有交叉關係。

機器學習(Machine Learning)是研究計算機怎樣模擬或實現人類的學習行爲，以獲取新的知識或技能，從新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心，是使計算機具備智能的根本途徑，其應用遍佈人工智能的各個領域，它主要使用概括、綜合而不是演繹。機器學習在人工智能的研究中具備十分重要的地位。一個不具備學習能力的智能系統難以稱得上是一個真正的智能系統，可是以往的智能系統都廣泛缺乏學習的能力。隨着人工智能的深刻發展，這些侷限性表現得越發突出。正是在這種情形下，機器學習逐漸成爲人工智能研究的核心之一。它的應用已遍佈人工智能的各個分支，如專家系統、自動推理、天然語言理解、模式識別、計算機視覺、智能機器人等領域。機器學習的研究是根據生理學、認知科學等對人類學習機理的瞭解，創建人類學習過程的計算模型或認識模型，發展各類學習理論和學習方法，研究通用的學習算法並進行理論上的分析，創建面向任務的具備特定應用的學習系統。這些研究目標相互影響相互促進。

人類研究計算機的目的，是爲了提升社會生產力水平，提升生活質量，把人從單調複雜甚至危險的工做中解救出來。今天的計算機在計算速度上已經遠遠超過了人，然而在不少方面，特別是在人類智能活動有關的方面例如在視覺功能、聽覺功能、嗅覺功能、天然語言理解能力功能等等方面，還不如人。

這種現狀沒法知足一些高級應用的要求。例如，咱們但願計算機可以及早地發現路上的可疑狀況並提醒汽車駕駛員以免發生事故，咱們更但願計算機能幫助咱們進行自動駕駛，目前的技術還不足以知足諸如此類高級應用的要求，還須要更多的人工智能研究成果和系統實現的經驗。

轉載時請以超連接形式標明文章原始出處和做者信息及本聲明 http://www.blogbus.com/shijuanfeng-logs/216968430.html