Computer vision is the emulation of biological vision using computers and machines. It deals with the problem of inferring three-dimensional (3D) information about the world and the objects in it from images or video data ---- a problem that humans and many biological organisms have to solve almost every instant for their survival. ide
計算機視覺既是工程領域,也是科學領域中的一個富有挑戰性重要研究領域。計算機視覺是一門綜合性的學科,它已經吸引了來自各個學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學,神經生理學和認知科學等。人工智能
視覺是各個應用領域,如製造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各類智能/自主系統中不可分割的一部分。因爲它的重要性,一些先進國家,例如美國把對計算機視覺的研究列爲對經濟和科學有普遍影響的科學和工程中的重大基本問題,即所謂的重大挑戰(grand challenge)。計算機視覺的挑戰是要爲計算機和機器人開發具備與人類水平至關的視覺能力。機器視覺須要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把全部這些處理都緊密地集成在一塊兒。[Neg91]做爲一門學科,計算機視覺開始於60年代初,但在計算機視覺的基本研究中的許多重要進展是在80年代取得的。如今計算機視覺已成爲一門不一樣於人工智能、圖象處理、模式識別等相關領域的成熟學科。計算機視覺與人類視覺密切相關,對人類視覺有一個正確的認識將對計算機視覺的研究很是有益。爲此咱們將先介紹人類視覺。orm
人類正在進入信息時代,計算機將愈來愈普遍地進入幾乎全部領域。一方面是更多未經計算機專業訓練的人也須要應用計算機,而另外一方面是計算機的功能愈來愈強,使用方法愈來愈複雜。這就令人在進行交談和通信時的靈活性與目前在使用計算機時所要求的嚴格和死板之間產生了尖銳的矛盾。人可經過視覺和聽覺,語言與外界交換信息,而且可用不一樣的方式表示相同的含義,而目前的計算機卻要求嚴格按照各類程序語言來編寫程序,只有這樣計算機才能運行。爲使更多的人能使用複雜的計算機,必須改變過去的那種讓人來適應計算機,來死記硬背計算機的使用規則的狀況。而是反過來讓計算機來適應人的習慣和要求,以人所習慣的方式與人進行信息交換,也就是讓計算機具備視覺、聽覺和說話等能力。這時計算機必須具備邏輯推理和決策的能力。具備上述能力的計算機就是智能計算機。three
智能計算機不但使計算機更便於爲人們所使用,同時若是用這樣的計算機來控制各類自動化裝置特別是智能機器人,就可使這些自動化系統和智能機器人具備適應環境,和自主做出決策的能力。這就能夠在各類場合取代人的繁重工做,或代替人到各類危險和惡劣環境中完成任務。開發
計算機視覺就是用各類成象系統代替視覺器官做爲輸入敏感手段,由計算機來代替大腦完成處理和解釋。計算機視覺的最終研究目標就是使計算機能象人那樣經過視覺觀察和理解世界,具備自主適應環境的能力。要通過長期的努力才能達到的目標。所以,在實現最終目標之前,人們努力的中期目標是創建一種視覺系統,這個系統能依據視覺敏感和反饋的某種程度的智能完成必定的任務。例如,計算機視覺的一個重要應用領域就是自主車輛的視覺導航,目前尚未條件實現象人那樣能識別和理解任何環境,完成自主導航的系統。所以,目前人們努力的研究目標是實如今高速公路上具備道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統。這裏要指出的一點是在計算機視覺系統中計算機起代替人腦的做用,但並不意味着計算機必須按人類視覺的方法完成視覺信息的處理。計算機視覺能夠並且應該根據計算機系統的特色來進行視覺信息的處理。可是,人類視覺系統是迄今爲止,人們所知道的功能最強大和完善的視覺系統。如在如下的章節中會看到的那樣,對人類視覺處理機制的研究將給計算機視覺的研究提供啓發和指導。所以,用計算機信息處理的方法研究人類視覺的機理,創建人類視覺的計算理論,也是一個很是重要和信人感興趣的研究領域。這方面的研究被稱爲計算視覺(Computational Vision)。計算視覺可被認爲是計算機視覺中的一個研究領域。文檔
有很多學科的研究目標與計算機視覺相近或與此有關。這些學科中包括圖象處理、模式識別或圖象識別、景物分析、圖象理解等。因爲歷史發展或領域自己的特色這些學科互有差異,但又有某種程度的相互重迭。爲了清晰起見,咱們把這些與計算機視覺有關的學科研究目標和方法的角度加以概括。數學
圖象處理技術把輸入圖象轉換成具備所但願特性的另外一幅圖象。例如,可經過處理使輸出圖象有較高的信-噪比,或經過加強處理突出圖象的細節,以便於操做員的檢驗。在計算機視覺研究中常常利用圖象處理技術進行預處理和特徵抽取。it
模式識別技術根據從圖象抽取的統計特性或結構信息,把圖象分紅予定的類別。例如,文字識別或指紋識別。在計算機視覺中模式識別技術常常用於對圖象中的某些部分,例如分割區域的識別和分類。自動化
給定一幅圖象,圖象理解程序不只描述圖象自己,並且描述和解釋圖象所表明的景物,以便對圖象表明的內容做出決定。在人工智能視覺研究的初期常用景物分析這個術語,以強調二維圖象與三維景物之間的區別。圖象理解除了須要複雜的圖象處理之外還須要具備關於景物成象的物理規律的知識以及與景物內容有關的知識。io
在創建計算機視覺系統時須要用到上述學科中的有關技術,但計算機視覺研究的內容要比這些學科更爲普遍。計算機視覺的研究與人類視覺的研究密切相關。爲實現創建與人的視覺系統相相似的通用計算機視覺系統的目標須要創建人類視覺的計算機理論。
(內容來自圖像處理知識庫)