【計算機視覺】計算機視覺領域資料收集

目錄 (?) [+]

通用庫General Library
圖像視頻IOImage Video IO
AR相關Augmented Reality
局部不變特徵Local Invariant Feature
目標檢測Object Detection
近似最近鄰ANN
SLAM SFM
圖像分割Segmentation
目標跟蹤Tracking
直線檢測Line Detection
指紋Finger Print
視覺顯著性Visual Salience
FFTDWT
音頻處理Audio processing

Feature Extraction
Image Segmentation
Object Detection
Saliency Detection
Image Classification
Image Matting

視覺跟蹤綜述
目標跟蹤是絕大多數視覺系統中不可或缺的環節。在二維視頻跟蹤算法中,基於目標顏色信息或基於目標運動信息等方法是經常使用的跟蹤方法。從以往的研究中咱們發現,大多數普通攝像頭(彩色攝像頭)下非基於背景建模的跟蹤算法都極易受光照條件的影響。這是由於顏色變化在某種程度上是光學的色彩變化形成的。如基於體素和圖像像素守恆假設的光流算法它也是假設一個物體的顏色在先後兩幀沒有巨大而明顯的變化。

但在特定的場景應用中(如視頻監控等領域),不失有一些經典的跟蹤算法能夠實現較好的跟蹤效果。如下主要介紹三種經典的跟蹤算法:CamShift算法、光流跟蹤以及粒子濾波算法。最後將給出一個各類跟蹤方法間的比較。

一、 CamShift( Continuously Adaptive Mean Shift )跟蹤算法

CamShift算法是一種基於均值漂移的算法。均值移動的理論基礎是機率密度估計。均值移動的過程實際上就是在機率密度空間中尋找局部極大點。從其全稱可知CamShift的算法基礎其實是MeanShift算法,均值移動的操做過程可用以下幾步來表示:

(a) 計算以初始點x­0爲中心的某一核窗所對應的均值移動向量mG(x0);

(b) 根據mG(x0)來移動核窗的中心位置,也即把mG(x0)中的加權平均值部分賦予x0,把x0做爲新的初始點,並轉回步驟(a);

(c) 重複(a)、(b)過程,直到知足某一預約的條件。

所以,均值移動過程就是尋找數據分佈最密處的過程。

均值移動的實現過程可圖示爲:

  (1) 計算目標區域的均值、移動目標區域

  

  (2) 從新計算目標區域均值,還存在移動向量,繼續移動目標區域

  

  (3) 移動向量愈來愈小

  

  

  (4) 找到局部極大點,中止移動

  

  

  以上過程只是一次MeanShift算法過程,在連續幀上使用MeanShift算法就是CamShift跟蹤算法。CamShift同經典的均值移動跟蹤算法的基本思想是相同的,所不一樣的它是創建在顏色機率分佈圖和矩的基礎之上。CamShift對室內環境下的目標跟蹤具備較高的魯棒性。

一、 光流跟蹤算法

將三維空間中的目標和場景對應於二維圖像平面運動時,他們在二維圖像平面的投影就造成了運動,這種運動以圖像平面亮度模式表現出來的流動就稱爲光流。光流法是對運動序列圖像進行分析的一個重要方法,光流不只包含圖像中目標的運動信息,並且包含了三維物理結構的豐富信息,所以可用來肯定目標的運動狀況以及反映圖像其它等信息。

光流是空間運動物體在觀測成像面上的像素運動的瞬時速度。光流的研究是利用圖像序列中的像素強度數據的時域變化和相關性來肯定各自像素位置的「 運動 」,即研究圖像灰度在時間上的變化與景象中物體結構及其運動的關係。通常狀況下,光流由相機運動、 場景 中目標運動或二者的共同運動產生。光流計算方法大體可分爲三類:基於匹配的、頻域的和梯度的方法。
  (1) 基於匹配的光流計算方法包括基於特徵和基於區域兩種。基於特徵的方法不斷地對目標主要特徵進行定位和跟蹤,對大目標的運動和亮度變化具備魯棒性。存在的問題是光流一般很稀疏,並且特徵提取和精確匹配也十分困難。基於區域的方法先對相似的區域進行定位,而後經過類似區域的位移計算光流。這種方法在視頻編碼中獲得了普遍的應用。然而,它計算的光流仍不稠密。
  (2) 基於頻域的方法利用速度可調的濾波組輸出頻率或相位信息。雖然能得到高精度的初始光流估計,但每每涉及複雜的計算。另外,進行可靠性評價也十分困難。
  (3) 基於梯度的方法利用圖像序列的時空微分計算2D速度場(光流)。因爲計算簡單和較好的效果,基於梯度的方法獲得了普遍的研究。雖然不少基於梯度的光流估計方法取得了較好的光流估計,但因爲在計算光流時涉及到可調參數的人工選取、可靠性評價因子的選擇困難,以及預處理對光流計算結果的影響,在應用光流對目標進行實時監測與自動跟蹤時仍存在不少問題。
  光流法檢測運動物體的基本原理是:給圖像中的每個像素點賦予一個速度矢量,這就造成了一個圖像運動場,在運動的一個特定時刻,圖像上的點與三維物體上的點一一對應,這種對應關係可由投影關係獲得,根據各個像素點的速度矢量特徵,能夠對圖像進行動態分析。若是圖像中沒有運動物體,則光流矢量在整個圖像區域是連續變化的。當圖像中有運動物體時,目標和圖像背景存在相對運動,運動物體所造成的速度矢量必然和鄰域背景速度矢量不一樣,從而檢測出運動物體及位置。採用光流法進行運動物體檢測的問題主要在於大多數光流法計算耗時,實時性和實用性都較差。可是光流法的優勢在於光流不只攜帶了運動物體的運動信息,並且還攜帶了有關景物三維結構的豐富信息,它可以在不知道場景的任何信息的狀況下,檢測出運動對象。

  

  對於視頻監控系統來講,所用的圖像基本都是攝像機靜止狀態下攝取得,因此對有實時性和準確性要求的系統來講,純粹使用光流法來檢測目標不太實際。更多的是利用光流計算方法與其它方法相結合來實現對目標檢測和運動估計。
  然而,在實際應用中,因爲遮擋性、多光源、透明性和噪聲等緣由,使得光流場基本方程的灰度守恆假設條件不能知足,不能求解出正確的光流場,同時大多數的光流計算方法至關複雜,計算量巨大,不能知足實時的要求,所以,通常不被對精度和實時性要求比較高的 監控 系統所採用。

三、 粒子濾波跟蹤算法

粒子濾波算法有不少變種,以Rob Hess實現的這種最基本的粒子濾波算法爲例。它的核心思想是隨機採樣和重要性重採樣。在不知道目標在哪裏的狀況下,隨機向場景中分散粒子,撒完粒子後,根據特徵類似度計算每一個粒子的重要性,而後在重要的地方多撒粒子,不重要的地方少撒粒子。因此說粒子濾波較之蒙特卡洛濾波計算量較小。這種思想雖然簡單,但效果每每很好。

粒子濾波實現對目標的跟蹤一般分如下四個步驟:

(1) 初始化階段-提取跟蹤目標特徵

該階段要人工指定跟蹤目標,程序計算跟蹤目標的特徵,好比能夠採用目標的顏色特徵。這點和CamShift算法相似,不能實現自動初始化。但咱們能夠在初始時給定一個顏色樣本,實現程序的半自動初始化。而後計算該區域色調(Hue)空間的直方圖,即爲目標的特徵。直方圖能夠用一個向量來表示,因此目標特徵就是一個N*1的向量V。

(2) 搜索階段—分撒搜索粒子

獲取目標特徵後,在場景中分撒許多搜索粒子去搜索目標對象。粒子分撒有許多種方式。好比,a) 均勻分撒。即在整個圖像平面均勻的撒粒子(uniform distribution);b)在上一幀獲得的目標附近按照高斯分佈來放,能夠理解成,靠近目標的地方多放,遠離目標的地方少放。Rob Hess的代碼用的是後一種方法。粒子放出去後按照初始化階段獲得的目標特徵(色調直方圖,向量V)計算它所處的位置處圖像的顏色特徵,獲得一個色調直方圖,向量Vi,計算該直方圖與目標直方圖的類似性(直方圖匹配)。類似性有多種度量,最簡單的一種是計算sum(abs(Vi-V))。每一個粒子算出類似度後再作一次歸一化,使得全部的粒子獲得的類似度加起來等於1。

(3) 決策階段

分撒出去的每一個粒子將返回其所處位置的圖像信息。好比,「一號粒子處圖像與目標的類似度是0.3」,「二號粒子處圖像與目標的類似度是0.02」,「三號粒子處圖像與目標的類似度是0.0003」,「N號粒子處圖像與目標的類似度是0.013」而後作加權平均。設N號粒子的圖像像素座標是(Xn,Yn),它報告的類似度是Wn,因而目標最可能的像素座標X = sum(Xn*Wn),Y = sum(Yn*Wn)。

(4) 重採樣階段Resampling

在新的一幀圖像裏,爲了搜索到目標的新位置,須要再分撒粒子進行搜索。但如今應該怎樣分撒呢?這要根據上一幀各個粒子返回的類似度報告。好比,「一號粒子處圖像與目標的類似度是0.3」,「二號粒子處圖像與目標的類似度是0.02」,「三號粒子處圖像與目標的類似度是0.0003」,「N號粒子處圖像與目標的類似度是0.013」。綜合全部粒子的報告,一號粒子處的類似度最高,三號粒子處的類似度最低,因而要從新分撒粒子,在類似度最高的粒子那裏放更多條粒子,在類似度最低的粒子那裏少放粒子,甚至把原來那條粒子也撤回來。這就是Sampling
Importance Resampling,根據重要性重採樣(更具重要性從新放粒子)。

(2)->(3)->(4)->(2)如是反覆循環,即完成了目標的動態跟蹤。

粒子濾波跟蹤算法可用於視頻監控領域,能夠跟蹤速度較快的跟蹤目標。



四、 其餘跟蹤算法及優缺點

  將其餘一些經常使用的跟蹤算法及優缺點造成了一個表,其原理不作贅述,可參閱相關文獻。

  

local orientation correlation (LOC) , flocks of features tracking (FF) , optical flow tracking using templates on a regular grid (OF) and local feature tracking, KLT-tracker(KLT) , and boosted detection (BD).



參考

[1] 《基於均值移動的人臉跟蹤簡介》 未公開

[2]  http://kb.cnblogs.com/a/1742263/

[3] AIDIA – Adaptive Interface for Display Interaction

[4]  http://baike.baidu.com/view/2810997.htm

分類:  目標跟蹤
posted @ 2012-04-18 16:05 Hanson-jun 閱讀(68) 評論(0)  編輯

機器視覺開源處理庫彙總

cvchina 搞到的機器視覺開源處理庫彙總,轉來了,很給力,還在不斷更新。。。


通用庫/General Library

OpenCV

無需多言。

RAVL

Recognition And Vision Library. 線程安全。強大的IO機制。包含AAM。

CImg

很酷的一個圖像處理包。整個庫只有一個頭文件。包含一個基於PDE的光流算法。


圖像,視頻IO/Image, Video IO

FreeImage
DevIL
ImageMagick
FFMPEG
VideoInput
portVideo


AR相關/Augmented Reality

ARToolKit

基於Marker的AR庫

ARToolKitPlus

ARToolKit的加強版。實現了更好的姿態估計算法。

PTAM

實時的跟蹤、SLAM、AR庫。無需Marker,模板,內置傳感器等。

BazAR

基於特徵點檢測和識別的AR庫。


局部不變特徵/Local Invariant Feature

VLFeat

目前最好的Sift開源實現。同時包含了KD-tree,KD-Forest,BoW實現。

Ferns

基於Naive Bayesian Bundle的特徵點識別。高速,但佔用內存高。

SIFT By Rob Hess

基於OpenCV的Sift實現。


目標檢測/Object Detection

AdaBoost By JianXin.Wu

又一個AdaBoost實現。訓練速度快。

行人檢測 By JianXin.Wu

基於Centrist和Linear SVM的快速行人檢測。


(近似)最近鄰/ANN

FLANN

目前最完整的(近似)最近鄰開源庫。不但實現了一系列查找算法,還包含了一種自動選取最快算法的機制。

ANN

另一個近似最近鄰庫。


SLAM & SFM

SceneLib  [LGPL]

monoSLAM庫。由Androw Davison開發。


圖像分割/Segmentation

SLIC Super Pixel

使用Simple Linear Iterative Clustering產生指定數目,近似均勻分佈的Super Pixel。


目標跟蹤/Tracking

TLD

基於Online Random Forest的目標跟蹤算法。

KLT

Kanade-Lucas-Tracker

Online boosting trackers

Online Boosting Trackers


直線檢測/Line Detection

DSCC

基於聯通域鏈接的直線檢測算法。

LSD  [GPL]

基於梯度的,局部直線段檢測算子。


指紋/Finger Print

pHash  [GPL]

基於感知的多媒體文件Hash算法。(提取,對比圖像、視頻、音頻的指紋)


視覺顯著性/Visual Salience

Global Contrast Based Salient Region Detection

Ming-Ming Cheng的視覺顯著性算法。


FFT/DWT

FFTW  [GPL]

最快,最好的開源FFT。

FFTReal  [WTFPL]

輕量級的FFT實現。許可證是亮點。


音頻處理/Audio processing

STK  [Free]

音頻處理,音頻合成。

libsndfile  [LGPL]

音頻文件IO。

libsamplerate  [GPL ]

音頻重採樣。

小波變換

快速小波變換(FWT)

FWT

BRIEF: Binary Robust Independent Elementary Feature 一個很好的局部特徵描述子,裏面有FAST corner + BRIEF實現特徵點匹配的DEMO: http://cvlab.epfl.ch/software/brief/

http://code.google.com/p/javacv

Java打包的OpenCV, FFmpeg, libdc1394, PGR FlyCapture, OpenKinect, videoInput, and ARToolKitPlus庫。能夠放在Android上用~



libHIK,HIK SVM,計算HIK SVM跟Centrist的Lib。 http://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK.htm



一組視覺顯著性檢測代碼的連接: http://cg.cs.tsinghua.edu.cn/people/~cmm/saliency/





分類:  編碼雜記

posted @ 2012-04-18 16:05 Hanson-jun 閱讀(175) 評論(0)  編輯

不規則物體形狀匹配綜述
不規則物體形狀匹配綜述

 

  物體識別是計算機視覺應用的一項基本任務。識別一般基於目標物體的灰度信息、顏色信息或形狀信息。物體識別的目的就是要找到一個包含能夠區分不一樣目標物體的有效信息的描述。因爲要識別的物體是事先知道的,因此目標物體的幾何特徵能夠被直接應用到識別任務中。

  不規則物體的形狀匹配是一種有效的利用物體幾何特徵進行識別的方法。根據匹配對象的不一樣,能夠將不規則物體的形狀匹配分爲基於區域的匹配方法和基於輪廓的匹配方法。

1、基於輪廓特徵的形狀匹配

  基於輪廓特徵的形狀匹配在實際中更爲經常使用,這主要有兩方面的緣由:一是基於輪廓特徵的匹配計算量小,能夠較好的知足實時性要求;二是要識別的目標物一般是預先知道的,那麼它的幾何信息徹底能夠被用於識別過程當中。爲了識別不規則物體,主要任務就是設計一種基於(少許的)目標物幾何約束先驗知識的有效匹配方法。

1.  鏈碼直方圖(chain code histogram)

  鏈碼直方圖將人眼看上去類似的物體歸爲一類。所以利用它不能進行精確的識別和分類。

  方向鏈碼(Freeman鏈碼)是用來表示物體輪廓的典型鏈碼錶示法。一條離散曲線能夠定義爲Z2域內一組數量有限的8聯通點。所以,一條數字化二值曲線能夠用方向鏈碼錶示方向鏈碼是相鄰兩像素連線的8種可能的方向值。一條曲線被網格離散化後造成n個鏈碼方向,最終此曲線鏈碼可表示爲{ai}n,每條鏈指向8個方向重的一個方向,ai={0,1,2,3,4,5,6,7},i爲像素的索引值,ai是由像素(i)指向像素(i+1)的方向鏈碼。

  鏈碼直方圖的計算簡單並且快速。計算公式以下:

    

  其中,nk是一個鏈碼中鏈碼值k的數目,n是一個鏈碼中的節點數。

  

   (a)編碼的方向示意,(b)簡單物體形狀,(c)形狀的鏈碼錶示,(d)鏈碼直方圖

  鏈碼法的特色:

  (1) 計算量小,可知足實時性要求;

  (2) 具備平移、尺度不變性;

  (3) 具備90度旋轉不變性;

  (4) 規格化鏈碼直方圖能夠達到更好的旋轉不變性。

2. 成對幾何直方圖(Pairwise Geometric Histogram)

  成對幾何直方圖經過相對角和相對位置特徵來描述目標輪廓,並採用關係直方圖統計這對幾何特徵來進行形狀索引。採用這種編碼方式須要具有必定的前提,即對於一個不規則物體咱們能夠將其近似爲一個幾何多邊形。這種編碼方法能夠很好地描述一個多邊形物體。

  將不規則形狀近似爲多邊形,並將其定義爲邊緣點的集合。這樣它所包含的輪廓邊緣(線段)就能夠由連續的邊緣點來表示。接下來咱們計算多邊形的PGH:將每個輪廓邊緣視爲其方向上的基準線,那麼它與其餘輪廓邊緣間的相對角 以及最大最小垂直距離(dmin和dmax)能夠被計算出來。邊緣之間的角度定義了直方圖的行,而後在其中增長對應的計算出來的最大和最小距離的全部直方塊,就獲得了當前多邊形的PGH。

  它具備以下特色:

  (1) 計算簡單,可知足實時性要求;

  (2) 具備平移、尺度不變性;

  (3) 具備360度旋轉不變性。

3.  簡單形狀描述符的結合(Combination of Simple Shape Descriptors)

  如圖,它們是幾種簡單的形狀描述符,分別表明了凹凸性、主軸、緻密性、差別性和橢圓差別性。

  凹凸性:輪廓凸包周長與原輪廓周長的比率。(全部凸起的覆蓋輪廓稱爲凸包)

  主軸:過物體質心的正交軸,主軸之間的比例能夠由物體輪廓的協方差矩陣計算出來

  緻密性:物體區域面積與等面積的正方形周長的比例,也能夠是圓。

  差別性:表現爲與模板比較的比例均方偏差。

  

  單獨用這幾種簡單描述符的任何一種來表示形狀進行匹配,都不能達到較好的匹配結果。可是若是咱們將這五種簡單形狀描述符進行結合,同時用它們來描述一個形狀,那麼這個形狀的描述信息就很是豐富了,匹配的結果也會很好。

這種形狀描述方式具備以下的特色:

  (1) 單獨的任何一種簡單描述符都不能用於精確識別物體,可是多種簡單描述符的結合能夠達到很高的識別效率;

  (2) 計算簡單,能夠達到實時性;

  (3) 具備平移、尺度不變性;

  (4) 理論上360度旋轉不變性。

4.  基於hausdorff距離的形狀匹配

  Hausdorff距離用來計算兩個點集之間的匹配程度。給定兩個有限集A={a1,a2,…,ap}和B={b1,b2,…,bq},A,B之間的Hausdorff距離定義以下:

  

  其中:

  

  

  Hausdorff距離H(A,B)取h(A,B)和h(B,A)的最大值,這樣經過計算h(A,B)和h(B,A)就能夠得到兩個點集A,B之間的匹配程度。

  

  爲了減小計算量,能夠取角點進行匹配。但這樣匹配率將下降。基於hausdorff距離的形狀匹配的特色;

  (1) 對每一個邊緣點進行hausdorff距離計算,計算量稍大,但對不是過於複雜的輪廓(如小尺寸輪廓),能夠知足實時性;

  (2) 具備平移、尺度不變性;

  (3) 具備旋轉不變性;

2、基於區域特徵的形狀匹配

  基於不變矩的形狀匹配是典型的基於區域的匹配方法。其中,基於Hu不變矩的形狀匹配應用最爲普遍。

圖像的矩函數在模式識別、目標分類中獲得了普遍的應用。在1961年首先基於代數不變量引入矩不變量。經過對幾何矩的非線性組合,導出了一組對於圖像平移、尺度、旋轉變化不變的矩,這種矩就成爲Hu矩。

一幅大小爲M×N的二維圖像其中(p+q)階矩:



對於二值圖像,其零階矩就是該形狀區域的面積。所以,將面積歸一化,每個圖像矩除以零階矩獲得的商具備形狀的尺度變化無關性。

  求圖像的p+q階中心矩,面積歸一化,使得具備平移、尺度不變性。

  (1)

  (2)

  計算圖像的7個面積歸一化的中心矩,{m11,m02,m20,m21,m12,m03,m30}Hu不變矩是關於這7個矩的函數。具備平移、旋轉和尺度不變性。

  

  彩色圖像Hu不變矩的計算流程以下:

  

  基於Hu矩的形狀匹配所具備的特色:

  (1) Hu不變矩只能用於對區域的檢測,不能用於邊界的檢測,但因爲計算簡單,計算量不大,能夠知足實時性;

  (2) 具備平移、尺度不變性;

  (3) 具備旋轉不變性。

3、匹配方法間的比較

  

  

  CCH(鏈碼直方圖):是一種基於輪廓匹配方法。具備較強的平移不變性,尺度不變性通常,具備90度的旋轉不變性。因爲編碼簡單,執行速度快。計算量和所需內存都較小,適合差異明顯的物體,對平滑和非平滑物體的識別並不明顯;

  PGH(成對幾何直方圖):是一種基於輪廓匹配方法。具備較強的平移不變性和尺度不變性,具備360度的旋轉不變性。執行速度快,能夠較好地識別多邊形物體和部分自封閉的物體,因爲它的計算過程,對非多邊形物體的識別可能會浪費計算量;

  CFSS(五種簡單形狀描述符結合):是一種基於輪廓匹配方法。具備較強的平移不變性和尺度不變性,具備360度的旋轉不變性。執行速度處於CCH方法和PGH方法之間。識別率與PGH至關,可是比它須要更少的計算時間和內存。

  HAUSDORFF距離:是一種基於輪廓匹配方法。具備較強的平移不變性,可是尺度不變性和旋轉不變性都較差。因爲處理的數據維數較多,執行效率是這五種方法中最慢的一個。可用於匹配部分重和形狀物體。

  Hu不變矩:是一種基於區域的形狀匹配方法。具備較強的平移、尺度和旋轉不變性,其中旋轉不變性爲360度。但因爲匹配的數據量大,執行速度較慢。適合於進行一些更精確的匹配。

分類:  目標識別
posted @ 2012-04-18 16:04 Hanson-jun 閱讀(42) 評論(0)  編輯

Hough變換原理
1、簡單介紹
Hough變換是圖像處理中從圖像中識別幾何形狀的基本方法之一。Hough變換的基本原理在於利用點與線的對偶性,將原始圖像空間的給定的曲線經過曲線表達形式變爲參數空間的一個點。這樣就把原始圖像中給定曲線的檢測問題轉化爲尋找參數空間中的峯值問題。也即把檢測總體特性轉化爲檢測局部特性。好比直線、橢圓、圓、弧線等。
2、Hough變換的基本思想
設已知一黑白圖像上畫了一條直線,要求出這條直線所在的位置。咱們知道,直線的方程能夠用y=k*x+b 來表示,其中k和b是參數,分別是斜率和截距。過某一點(x0,y0)的全部直線的參數都會知足方程y0=kx0+b。即點(x0,y0)肯定了一族直線。方程y0=kx0+b在參數k--b平面上是一條直線,(你也能夠是方程b=-x0*k+y0對應的直線)。這樣,圖像x--y平面上的一個前景像素點就對應到參數平面上的一條直線。咱們舉個例子說明解決前面那個問題的原理。設圖像上的直線是y=x,
咱們先取上面的三個點:A(0,0), B(1,1), C(22)。能夠求出,過A點的直線的參數要知足方程b=0, 過B點的直線的參數要知足方程1=k+b, 過C點的直線的參數要知足方程2=2k+b, 這三個方程就對應着參數平面上的三條直線,而這三條直線會相交於一點(k=1,b=0)。 同理,原圖像上直線y=x上的其它點(如(3,3),(4,4)等) 對應參數平面上的直線也會經過點(k=1,b=0)。這個性質就爲咱們解決問題提供了方法,就是把圖像平面上的點對應到參數平面上的線,最後經過統計特性來解決問題。假如圖像平面上有兩條直線,那麼最終在參數平面上就會看到兩個峯值點,依此類推。
簡而言之,Hough變換思想爲:在原始圖像座標系下的一個點對應了參數座標系中的一條直線,一樣參數座標系的一條直線對應了原始座標系下的一個點,而後,原始座標系下呈現直線的全部點,它們的斜率和截距是相同的,因此它們在參數座標系下對應於同一個點。這樣在將原始座標系下的各個點投影到參數座標系下以後,看參數座標系下有沒有匯集點,這樣的匯集點就對應了原始座標系下的直線。
在實際應用中,y=k*x+b形式的直線方程沒有辦法表示x=c形式的直線(這時候,直線的斜率爲無窮大)。因此實際應用中,是採用參數方程p=x*cos(theta)+y*sin(theta)。這樣,圖像平面上的一個點就對應到參數p---theta平面上的一條曲線上,其它的仍是同樣。
3、Hough變換推廣
一、已知半徑的圓
其實Hough變換能夠檢測任意的已知表達形式的曲線,關鍵是看其參數空間的選擇,參數空間的選擇能夠根據它的表達形式而定。好比圓的表達形式爲 ,因此當檢測某一半徑的圓的時候,能夠選擇與原圖像空間一樣的空間做爲參數空間。那麼圓圖像空間中的一個圓對應了參數空間中的一個點,參數空間中的一個點對應了圖像空間中的一個圓,圓圖像空間中在同一個圓上的點,它們的參數相同即a,b相同,那麼它們在參數空間中的對應的圓就會過同一個點(a,b),因此,將原圖像空間中的全部點變換到參數空間後,根據參數空間中點的彙集程度就能夠判斷出圖像空間中有沒有近似於圓的圖形。若是有的話,這個參數就是圓的參數。
二、未知半徑的圓
對於圓的半徑未知的狀況下,能夠看做是有三個參數的圓的檢測,中心和半徑。這個時候原理仍然相同,只是參數空間的維數升高,計算量增大。圖像空間中的任意一個點都對應了參數空間中的一簇圓曲線。 ,實際上是一個圓錐型。參數空間中的任意一個點對應了圖像空間中的一個圓。
三、橢圓
橢圓有5個自由參數,因此它的參數空間是5維的,所以他的計算量很是大,因此提出了許多的改進算法。
4、總結

圖像空間中的在同一個圓,直線,橢圓上的點,每個點都對應了參數空間中的一個圖形,在圖像空間中這些點都知足它們的方程這一個條件,因此這些點,每一個投影后獲得的圖像都會通過這個參數空間中的點。也就是在參數空間中它們會相交於一點。因此,當參數空間中的這個相交點的越大的話,那麼說明元圖像空間中知足這個參數的圖形越飽滿。越象咱們要檢測的東西。
Hough變換可以查找任意的曲線,只要你給定它的方程。Hough變換在檢驗已知形狀的目標方面具備受曲線間斷影響小和不受圖形旋轉的影響的優勢,即便目標有稍許缺損或污染也能被正確識別。

轉自: http://blog.csdn.net/icerain_3321/article/details/1665280

posted @ 2012-04-18 16:02 Hanson-jun 閱讀(24) 評論(0)  編輯

介紹n款計算機視覺庫/人臉識別開源庫/軟件
計算機視覺庫 OpenCV

OpenCV是Intel®開源計算機視覺庫。它由一系列 C 函數和少許 C++ 類構成,實現了圖像處理和計算機視覺方面的不少通用算法。 OpenCV 擁有包括 300 多個C函數的跨平臺的中、高層 API。它不依賴於其它的外部庫——儘管也可使用某些外部庫。 OpenCV 對非商業...
人臉識別 faceservice.cgi

faceservice.cgi 是一個用來進行人臉識別的 CGI 程序, 你能夠經過上傳圖像,而後該程序即告訴你人臉的大概座標位置。faceservice是採用 OpenCV 庫進行開發的。
OpenCV的.NET版 OpenCVDotNet

OpenCVDotNet 是一個 .NET 對 OpenCV 包的封裝。
人臉檢測算法 jViolajones

jViolajones是人臉檢測算法Viola-Jones的一個Java實現,並可以加載OpenCV XML文件。 示例代碼:http://www.oschina.net/code/snippet_12_2033
Java視覺處理庫 JavaCV

JavaCV 提供了在計算機視覺領域的封裝庫,包括:OpenCV、ARToolKitPlus、libdc1394 2.x 、PGR FlyCapture和FFmpeg。此外,該工具能夠很容易地使用Java平臺的功能。 JavaCV還帶有硬件加速的全屏幕圖像顯示(CanvasFrame),易於在多個內核中執行並行代碼(並...
運動檢測程序 QMotion

QMotion 是一個採用 OpenCV 開發的運動檢測程序,基於 QT。
視頻監控系統 OpenVSS

OpenVSS - 開放平臺的視頻監控系統 - 是一個系統級別的視頻監控軟件視頻分析框架(VAF)的視頻分析與檢索和播放服務,記錄和索引技術。它被設計成插件式的支持多攝像頭平臺,多分析儀模塊(OpenCV的集成),以及多核心架構。
手勢識別 hand-gesture-detection

手勢識別,用OpenCV實現
人臉檢測識別 mcvai-tracking

提供人臉檢測、識別與檢測特定人臉的功能,示例代碼 cvReleaseImage( &gray ); cvReleaseMemStorage(&storage); cvReleaseHaarClassifierCascade(&cascade);...
人臉檢測與跟蹤庫 asmlibrary

Active Shape Model Library (ASMLibrary©) SDK, 用OpenCV開發,用於人臉檢測與跟蹤。
Lua視覺開發庫 libecv

ECV 是 lua 的計算機視覺開發庫(目前只提供linux支持)
OpenCV的.Net封裝 OpenCVSharp

OpenCVSharp 是一個OpenCV的.Net wrapper,應用最新的OpenCV庫開發,使用習慣比EmguCV更接近原始的OpenCV,有詳細的使用樣例供參考。
3D視覺庫 fvision2010

基於OpenCV構建的圖像處理和3D視覺庫。 示例代碼: ImageSequenceReaderFactory factory; ImageSequenceReader* reader = factory.pathRegex("c:/a/im_%03d.jpg", 0, 20); //ImageSequenceReader* reader = factory.avi("a.avi"); if (reader == NULL) { ...
基於QT的計算機視覺庫 QVision

基於 QT 的面向對象的多平臺計算機視覺庫。能夠方便的建立圖形化應用程序,算法庫主要從 OpenCV,GSL,CGAL,IPP,Octave 等高性能庫借鑑而來。
圖像特徵提取 cvBlob

cvBlob 是計算機視覺應用中在二值圖像裏尋找連通域的庫.可以執行連通域分析與特徵提取.
實時圖像/視頻處理濾波開發包 GShow

GShow is a real-time image/video processing filter development kit. It successfully integrates DirectX11 with DirectShow framework. So it has the following features: GShow 是實時 圖像/視頻 處理濾波開發包,集成DiretX11。...
視頻捕獲 API VideoMan

VideoMan 提供一組視頻捕獲 API 。支持多種視頻流同時輸入(視頻傳輸線、USB攝像頭和視頻文件等)。能利用 OpenGL 對輸入進行處理,方便的與 OpenCV,CUDA 等集成開發計算機視覺系統。
開放模式識別項目 OpenPR

Pattern Recognition project(開放模式識別項目),致力於開發出一套包含圖像處理、計算機視覺、天然語言處理、模式識別、機器學習和相關領域算法的函數庫。
OpenCV的Python封裝 pyopencv

OpenCV的Python封裝,主要特性包括: 提供與OpenCV 2.x中最新的C++接口極爲類似的Python接口,而且包括C++中不包括的C接口 提供對OpenCV 2.x中全部主要部件的綁定:CxCORE (almost complete), CxFLANN (complete), Cv (complete), CvAux (C++ part almost...
視覺快速開發平臺 qcv

計算機視覺快速開發平臺,提供測試框架,使開發者能夠專一於算法研究。
圖像捕獲 libv4l2cam

對函數庫v412的封裝,從網絡攝像頭等硬件得到圖像數據,支持YUYV裸數據輸出和BGR24的OpenCV IplImage輸出
計算機視覺算法 OpenVIDIA

OpenVIDIA projects implement computer vision algorithms running on on graphics hardware such as single or multiple graphics processing units(GPUs) using OpenGL, Cg and CUDA-C. Some samples will soon support OpenCL and Direct Compute API'...
高斯模型點集配准算法 gmmreg

實現了基於混合高斯模型的點集配准算法,該算法描述在論文: A Robust Algorithm for Point Set Registration Using Mixture of Gaussians, Bing Jian and Baba C. Vemuri. ,實現了C++/Matlab/Python接口...
模式識別和視覺庫 RAVL

Recognition And Vision Library (RAVL) 是一個通用 C++ 庫,包含計算機視覺、模式識別等模塊。
圖像處理和計算機視覺經常使用算法庫 LTI-Lib

LTI-Lib 是一個包含圖像處理和計算機視覺經常使用算法和數據結構的面向對象庫,提供 Windows 下的 VC 版本和 Linux 下的 gcc 版本,主要包含如下幾方面內容: 一、線性代數 二、聚類分析 三、圖像處理 四、可視化和繪圖工具
OpenCV優化 opencv-dsp-acceleration

優化了OpenCV庫在DSP上的速度。
C++計算機視覺庫 Integrating Vision Toolkit

Integrating Vision Toolkit (IVT) 是一個強大而迅速的C++計算機視覺庫,擁有易用的接口和麪向對象的架構,而且含有本身的一套跨平臺GUI組件,另外能夠選擇集成OpenCV
計算機視覺和機器人技術的工具包 EGT

The Epipolar Geometry Toolbox (EGT) is a toolbox designed for Matlab (by Mathworks Inc.). EGT provides a wide set of functions to approach computer vision and robotics problems with single and multiple views, and with different vision se...
OpenCV的擴展庫 ImageNets

ImageNets 是對OpenCV 的擴展,提供對機器人視覺算法方面友好的支持,使用Nokia的QT編寫界面。
libvideogfx

視頻處理、計算機視覺和計算機圖形學的快速開發庫。
Matlab計算機視覺包 mVision

Matlab 的計算機視覺包,包含用於觀察結果的 GUI 組件,貌似也中止開發了,拿來作學習用挺不錯的。
Scilab的計算機視覺庫 SIP

SIP 是 Scilab(一種免費的類Matlab編程環境)的圖像處理和計算機視覺庫。SIP 能夠讀寫 JPEG/PNG/BMP 格式的圖片。具有圖像濾波、分割、邊緣檢測、形態學處理和形狀分析等功能。
STAIR Vision Library

STAIR Vision Library (SVL) 最初是爲支持斯坦福智能機器人設計的,提供對計算機視覺、機器學習和機率統計模型的支持。
posted @ 2012-04-18 15:57 Hanson-jun 閱讀(111) 評論(0)  編輯

UIUC某童鞋收集的代碼合集

Jia-Bin Huang童鞋收集,此童鞋畢業於國立交通大學,以前拍過不少CVPR舉辦地科羅拉多州的照片,這裏大多爲matlab  code ,

link:  https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html

包括:


Feature Extraction:

SIFT [1] [ Demo program ][SIFT
Library] [ VLFeat ]
PCA-SIFT [2] [ Project ]
Affine-SIFT [3] [ Project ]
SURF [4] [ OpenSURF ] [Matlab
Wrapper]
Affine Covariant Features [5] [ Oxford project ]
MSER [6] [ Oxford project ] [ VLFeat ]
Geometric Blur [7] [ Code ]
Local Self-Similarity Descriptor [8] [ Oxford implementation ]
Global and Efficient Self-Similarity [9] [ Code ]
Histogram of Oriented Graidents [10] [ INRIA Object Localization Toolkit ] [OLT
toolkit for Windows]
GIST [11] [ Project ]
Shape Context [12] [ Project ]
Color Descriptor [13] [ Project ]
Pyramids of Histograms of Oriented Gradients [ Code ]
Space-Time Interest Points (STIP) [14] [ Code ]
Boundary Preserving Dense Local Regions [15][ Project ]


Image Segmentation:

Normalized Cut [1] [ Matlab code ]
Gerg Mori’ Superpixel code [2] [ Matlab code ]
Efficient Graph-based Image Segmentation [3] [ C++ code ] [Matlab
wrapper]
Mean-Shift Image Segmentation [4] [ EDISON C++ code ] [Matlab
wrapper]
OWT-UCM Hierarchical Segmentation [5] [ Resources ]
Turbepixels [6] [ Matlab code 32bit ] [Matlab
code 64bit] [ Updated code ]
Quick-Shift [7] [ VLFeat ]
SLIC Superpixels [8] [ Project ]
Segmentation by Minimum Code Length [9] [ Project ]
Biased Normalized Cut [10] [ Project ]
Segmentation Tree [11-12] [ Project ]
Entropy Rate Superpixel Segmentation [13] [ Code ]


Object Detection:

A simple object detector with boosting [ Project ]
INRIA Object Detection and Localization Toolkit [1] [ Project ]
Discriminatively Trained Deformable Part Models [2] [ Project ]
Cascade Object Detection with Deformable Part Models [3] [ Project ]
Poselet [4] [ Project ]
Implicit Shape Model [5] [ Project ]
Viola and Jones’s Face Detection [6] [ Project ]


Saliency Detection

Itti, Koch, and Niebur’ saliency detection [1] [ Matlab code ]
Frequency-tuned salient region detection [2] [ Project ]
Saliency detection using maximum symmetric surround [3] [ Project ]
Attention via Information Maximization [4] [ Matlab code ]
Context-aware saliency detection [5] [ Matlab code ]
Graph-based visual saliency [6] [ Matlab code ]
Saliency detection: A spectral residual approach. [7] [ Matlab code ]
Segmenting salient objects from images and videos. [8] [ Matlab code ]
Saliency Using Natural statistics. [9] [ Matlab code ]
Discriminant Saliency for Visual Recognition from Cluttered Scenes. [10] [ Code ]
Learning to Predict Where Humans Look [11] [ Project ]
Global Contrast based Salient Region Detection [12] [ Project ]


Image Classification

Pyramid Match [1] [ Project ]
Spatial Pyramid Matching [2] [ Code ]
Locality-constrained Linear Coding [3] [ Project ] [Matlab
code]
Sparse Coding [4] [ Project ] [Matlab
code]
Texture Classification [5] [ Project ]
Multiple Kernels for Image Classification [6] [ Project ]
Feature Combination [7] [ Project ]
SuperParsing [ Code ]


Image Matting

Closed Form Matting [ Code ]
Spectral Matting [ Project ]
Learning-based Matting [ Code ]

等等等等。。。。

你們能夠去那個網址本身看。。。。

posted @ 2012-04-18 15:53 Hanson-jun 閱讀(49) 評論(0)  編輯

圖像處理方面的網站   http://blog.damiles.com  

www.bernardotti.it 
http://www.ohloh.net/tags/recognition  
http://www.diphernet.com/   http://www.mat.ucsb.edu/projects/tater/ http://enblend.sourceforge.net/   http://www.infra.kth.se/courses/1N1652/ http://www.csie.ntu.edu.tw/~b93082/VFX/hw2/vfx02.htm#t3 http://graphics.cs.msu.ru/en/research/calibration/   http://www.vlfeat.org/~vedaldi/ http://svn.openframeworks.cc/browser/listing.php?repname=addons&path=%2FofxOpenCv%2Ftrunk%2FofxOpenCv%2F&rev=29&sc=1 http://cvlab.epfl.ch/software/ferns/index.php   http://staff.science.uva.nl/~rvalenti/index.php?content=projects   http://mpac.ee.ntu.edu.tw/~ck/project_panorama/#Downloads http://www.sharewareconnection.com/titles/cross-stitch.htm http://mpac.ee.ntu.edu.tw/~sutony/vfx_stitching/pano.htm http://mpac.ee.ntu.edu.tw/people.php   http://mpac.ee.ntu.edu.tw/index.php http://www.cse.cuhk.edu.hk/~csc5280/project3/RoyChan/index.htm http://personal.ie.cuhk.edu.hk/~gbq008/csc_project_3.htm http://graphics.cs.cmu.edu/courses/15-463/2008_fall/463.html   http://www-2.cs.cmu.edu/%7ecdtwigg/   http://cs-people.bu.edu/edwardaa/cs580/p1/p1.html#goals http://www.cs.toronto.edu/~smalik/2530/mosaic/results.html http://www.cs.princeton.edu/gfx/   http://idea.hosting.lv/a/gfx/ http://www.cs.toronto.edu/~esteger/mosaic/index.html   http://home.so-net.net.tw/lioucy http://web.ics.purdue.edu/~kim497/  
CUDA:
http://gforge.man.poznan.pl/gf/project/cudaopencv/scmsvn/ http://wiki.livedoor.jp/mikk_ni3_92/d/CUDA::2%C3%CD%B2%BD::%CA%A3%BF%F4%CB%E7 http://cudasample.net/  
1、研究羣體
http://www-2.cs.cmu.edu/~cil/vision.html  
這是卡奈基梅隆大學的計算機視覺研究組的主頁,上面提供很全的資料,從發表文章的下載到演示程序、測試圖像、經常使用連接、相關軟硬件,甚至還有一個搜索引擎。 
http://www.cmis.csiro.au/IAP/zimage.htm  
這是一個側重圖像分析的站點,通常。可是提供一個Image Analysis環境---ZIMAGE and SZIMAGE。 
http://www.via.cornell.edu/  
康奈爾大學的計算機視覺和圖像分析研究組,好像是電子和計算機工程系的。側重醫學方面的研究,可是在上面有至關不錯資源,關鍵是它正在建設中,可以跟蹤一些信息。 
http://www2.parc.com/istl/groups/did/didoverview.shtml  
有一個頗有意思的項目:DID(文檔圖像解碼)。 
http://www-cs-students.stanford.edu/  
斯坦福大學計算機系主頁,本身找吧:( 
http://www.fmrib.ox.ac.uk/analysis/  
主要研究:Brain Extraction Tool,Nonlinear noise reduction,Linear Image Registration,

Automated Segmentation,Structural brain change analysis,motion correction,etc. 
http://www.cse.msu.edu/prip/  
這是密歇根州立大學計算機和電子工程系的模式識別--圖像處理研究組,它的FTP上有許多的文章(NEW)。 
http://pandora.inf.uni-jena.de/p/e/index.html  
德國的一個數字圖像處理研究小組,在其上面能找到一些不錯的連接資源。 
http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html  
CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture. 
http://cfia.gmu.edu/  
The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links 

between academic institutes, industry and government agencies, and to transfer key technologies to 

help industry build next 

generation commercial and military imaging and multimedia systems. 
http://peipa.essex.ac.uk/info/groups.html  
能夠經過它來搜索全世界各地的知名的計算機視覺研究組(CV Groups),極力推薦。 

2、圖像處理GPL庫
http://www.ph.tn.tudelft.nl/~klamer/cppima.html  
Cppima 是一個圖像處理的C++函數庫。這裏有一個較全面介紹它的庫函數的文檔,固然你也能夠下載壓縮的GZIP包,裏面包含TexInfo格式的文檔。 
http://iraf.noao.edu/  
Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software 

system for the reduction and analysis of astronomical data. 
http://entropy.brni-jhu.org/tnimage.html  
一個很是不錯的Unix系統的圖像處理工具,看看它的截圖。你能夠在此基礎上構建本身的專用圖像處理工具包。 
http://sourceforge.net/projects/  
這是GPL軟件集散地,到這裏找你想要獲得的IP庫吧。 

3、搜索資源

固然這裏基本的搜索引擎仍是必需要依靠的,好比Google等,能夠到我經常使用的連接看看。下面的連接可能會節省你一些時間: 
http://sal.kachinatech.com/   http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml  
4、大拿網頁
http://www.ai.mit.edu/people/wtf/  
這位但是MIT人工智能實驗室的BILL FREEMAN。大名鼎鼎!專長是:理解--貝葉斯模型。 
http://www.merl.com/people/brand/  
MERL(Mitsubishi Electric Research Laboratory)中的擅長「Style Machine」高手。 
http://research.microsoft.com/~ablake/  
CV界極有聲望的A.Blake 1977年畢業於劍橋大學三一學院並或數學與電子科學學士學位。以後在MIT,Edinburgh,Oxford前後組建過研究小組併成爲Oxford的教授,直到1999年進入微軟劍橋研究中心。主要工做領域是計算機視覺。 
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html  
這位牛人好像正在學習漢語,而且蒐集了諸如「兩隻老虎(Two Tigers)」的歌曲,嘿嘿:)

他的主頁上面還有幾個牛:Shumeet Baluja, Takeo Kanade。他們的Face Detection做的絕對是世界一流。他畢業於卡奈基梅隆大學的計算機科學系,興趣是計算機視覺。 
http://www.ifp.uiuc.edu/yrui_ifp_home/html/huang_frame.html  
這位老牛在1963年就得到了MIT的博士學位!他領導的Image Lab比較出名的是指紋識別。 

--------------------------------------------------------------------------------

下面這些是我搜集的牛羣(大部分是如日中天的Ph.D們),能夠學習的是他們的Study Ways! 

Finn Lindgren(Sweden):Statistical image analysis  http://www.maths.lth.se/matstat/staff/finn/
Pavel Paclik(Prague):statistical pattern recognition  http://www.ph.tn.tudelft.nl/~pavel/  
Dr. Mark Burge:machine learning and graph theory  http://cs.armstrong.edu/burge/  
yalin Wang:Document Image Analysis  http://students.washington.edu/~ylwang/  
Geir Storvik: Image analysis  http://www.math.uio.no/~geirs/  
Heidorn  http://alexia.lis.uiuc.edu/~heidorn/  
Joakim Lindblad:Digital Image Cytometry  http://www.cb.uu.se/~joakim/index_eng.html  
S.Lavirotte:  http://www-sop.inria.fr/cafe/Stephane.Lavirotte/  
Sporring:scale-space techniques  http://www.lab3d.odont.ku.dk/~sporring/  
Mark Jenkinson:Reduction of MR Artefacts  http://www.fmrib.ox.ac.uk/~mark/  
Justin K. Romberg:digital signal processing  http://www-dsp.rice.edu/~jrom/  
Fauqueur:Image retrieval by regions of interest  http://www-rocq.inria.fr/~fauqueur/  
James J. Nolan:Computer Vision  http://cs.gmu.edu/~jnolan/  
Daniel X. Pape:Information  http://www.bucho.org/~dpape/  
Drew Pilant:remote sensing technology  http://www.geo.mtu.edu/~anpilant/index.html  
5、前沿期刊(TOP10)

這裏的期刊大部分均可以經過上面的大拿們的主頁間接找到,在這列出主要是爲了節省直接想找期刊投稿的兄弟的時間:) 

IEEE Trans. On PAMI  http://www.computer.org/tpami/index.htm  
IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm  
Pattern Recognition  http://www.elsevier.com/locate/issn/00313203  
Pattern Recognition Letters  http://www.elsevier.com/locate/issn/01678655  

神經網絡 

Neural Networks Tutorial Review 
http://hem.hj.se/~de96klda/NeuralNetworks.htm   ftp://ftp.sas.com/pub/neural/FAQ.html  
Image Compression with Neural Networks 
http://www.comp.glam.ac.uk/digimaging/neural.htm  
Backpropagator's Review 
http://www.dontveter.com/bpr/bpr.html  
Bibliographies on Neural Networks 
http://liinwww.ira.uka.de/bibliography/Neural/  
Intelligent Motion Control with an Artificial Cerebellum 
http://www.q12.org/phd.html  
Kernel Machines 
http://www.kernel-machines.org/  
Some Neural Networks Research Organizations 
http://www.ieee.org/nnc/   http://www.inns.org/  
Neural Network Modeling in Vision Research 
http://www.rybak-et-al.net/nisms.html  
Neural Networks and Machine Learning 
http://learning.cs.toronto.edu/  
Neural Application Software 
http://attrasoft.com  
Neural Network Toolbox for MATLAB 
http://www.mathworks.com/products/neuralnet/  
Netlab Software 
http://www.ncrg.aston.ac.uk/netlab/  
Kunama Systems Limited 
http://www.kunama.co.uk/  

Computer Vision 

Computer Vision Homepage, Carnegie Mellon University

www.cs.cmu.edu/~cil/vision.html

Annotated Computer Vision Bibliography 
http://iris.usc.edu/Vision-Notes/bibliography/contents.html   http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html  
Lawrence Berkeley National Lab Computer Vision and Robotics Applications 
http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html  
CVonline by University of Edinburgh 

The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision, www.dai.ed.ac.uk/CVonline

Computer Vision Handbook, www.cs.hmc.edu/~fleck/computer-vision-handbook

Vision Systems Courseware 

www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html

Research Activities in Computer Vision 
http://www-syntim.inria.fr/syntim/analyse/index-eng.html  
Vision Systems Acronyms 

www.vision-systems-design.com/vsd/archive/acronyms.html

Dictionary of Terms in Human and Animal Vision 
http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html  
Metrology based on Computer Vision 

www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html

Digital Photography

Digital Photography, Scanning, and Image Processing 

www.dbusch.com/scanners/scanners.html 

Educational Resources, Universities 

Center for Image Processing in Education 

www.cipe.com

Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology 
http://wally2.rit.edu/pubs/guides/imagingcall.html  
Mathematical Experiences through Image Processing, University of Washington 

www.cs.washington.edu/research/metip/metip.html

Vismod Tech Reports and Publications, MIT 
http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker  
Vision Lab PhD dissertation list, University of Antwerp 
http://wcc.ruca.ua.ac.be/~visielab/theses.html  
INRIA (France) Research Projects: Human-Computer Interaction, Image Processing, Data Management, Knowledge Systems 

www.inria.fr/Themes/Theme3-eng.html

Image Processing Resources 
http://eleceng.ukc.ac.uk/~rls3/Contents.htm  
Publications of Carsten Steger 
http://www9.informatik.tu-muenchen.de/people/steger/publications.html  
FAQs

comp.dsp FAQ 

www.bdti.com/faq/dsp_faq.htm

Robotics FAQ 

www.frc.ri.cmu.edu/robotics-faq

Where's the sci.image.processing FAQ? 

www.cc.iastate.edu/olc_answers/packages/graphics/sci.image.processing.faq.html

comp.graphics.algorithms FAQ, Section 3, 2D Image/Pixel Computations 

www.exaflop.org/docs/cgafaq

Astronomical Image Processing System FAQ 

www.cv.nrao.edu/aips/aips_faq.html

來自:  http://hi.baidu.com/jiamn/blog/item/aaa063f9ae34141d6c22ebce.html
posted @ 2012-04-18 15:48 Hanson-jun 閱讀(45) 評論(0)  編輯

計算機視覺文獻與代碼資源及資料

下面是前端時間蒐集整理的一些和計算機視覺、模式識別的資源,拿出來與你們分享下。之後,我將把圖像處理真正的做爲個人興趣來玩玩了,也許不把研究做爲謀生的手段,會更好些。

標題 做者 主題 關鍵字 類別 來源 備註
nipsfast.ppt Nando de Freitas N-Body problems in learning Fast N-Body Learning Ppt http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
nipsfgtf.ppt Ramani Duraiswami Fast Multipole Methods Fast Gaussian Transform FM and FGT ppt http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
Gray.pdf/ppt Alex Gray Statistical N-Body/Proximity Data Structures N-Body and Data Structures Ppt/pdf http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
dt-nips04.pdf/ppt Dan Huttenlocher Fast Distance Transforms FDT Ppt/pdf http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
High.pdf/ppt Alexander Gray Fast high-dimensional function integration Fast integration Ppt/pdf http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
Fast04.pdf/ppt David Lowe Fast high-dimensional feature indexing for object recognition Feature indexing Ppt/pdf http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
ihler-fast.pdf/ppt Alexander lhler Fast methods and non-parametric BP Non-parametric BP Ppt/pdf http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
fastview.pdf Dustin Lang Comparing fast methods Overview fast methods pdf http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
nbody_methods.tar.gz       code http://www.cs.ubc.ca/~awll/nbody_methods.html  
demo_rbpf_gauss.tar   Rao Blackwellised particle filtering for conditionally Gaussian Models particle filtering for conditionally code http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
demorbpfdbn.tar.gz   Rao Blackwellised Particle Filtering   code http://www.cs.ubc.ca/~nando/nipsfast/schedule.htmlhttp://www.cs.ubc.ca/~nando/software.html  
upf_demos.tar.gz   Unscented Particle Filter Particle Filter code http://www.cs.ubc.ca/~nando/nipsfast/schedule.html  
BPF_1_3.zip   BoostedParticle Filter Tracking code http://www.cs.ubc.ca/~okumak/research.html 1
flyer_14_800.mpg   Source image Database Image http://www.cs.ubc.ca/~okumak/research.html 1
trans_flyer_14_800.mpg   image transformed Database Image http://www.cs.ubc.ca/~okumak/research.html 1
LBP.c/h Topi Mäenpää LBP operator Texture code http://www.ee.oulu.fi/~topiolli/cpplibs/files/  
calibr_v30.zip   Camera Calibration Computer vision code http://www.ee.oulu.fi/mvg/page/camera_calibration
_toolbox_for_matlab
2
  LEAR(Learning and Recognition in Vision Common dataset Human/car horse soccer human actions dataset http://lear.inrialpes.fr/data 3
Lic.zip/highlight.zip Robby T. Tan Color Constancy Through Inverse Intensity Chromaticity Space Highlight Removal from single image code http://www.commsp.ee.ic.ac.uk/~rtan/  
2008_oxford_fog.pdf Robby T. Tan Defog Defog from single pdf http://www.commsp.ee.ic.ac.uk/~rtan/  
08_cvpr.pdf Robby T. Tan Defog Defog from single pdf http://www.commsp.ee.ic.ac.uk/~rtan/  
Retinex_frankle_mccann   Retinex   Code http://www.cs.sfu.ca/~colour/publications/IST-2000/ Some
Retinex_maccann99   Retinex   code http://www.cs.sfu.ca/~colour/publications/IST-2000/ pictures
Gamut.tar.bz2   Retinex   code http://kobus.ca/research/programs/colour_constancy/index.html  
Video.avi/dehaze.m   dehazing Raanan Fattal code http://www.cs.huji.ac.il/~raananf/projects/defog/index.html  
MPTK-Windows-bin-0-5-6-beta.zip Matching pursuit(MP) Alogrithm CNRS Code http://mptk.irisa.fr/downloads  
generateDictionaries.txt GenerateGabor Alogrithm   code http://www.scholarpedia.org/article/Matching_pursuit  
             
             
             
             
Notes:
1. 視頻和源碼都是對應的文章的:
Kenji Okuma, Ali Taleghani, Nando De Freitas, Jim Little, David G. Lowe.  Boosted Particle Filter: Multitarget Detection and Tracking.  the European Conference on Computer Vision(ECCV), May 2004.
2. 該網站下面還有其餘一些資源能夠下載:  http://www.ee.oulu.fi/mvg/page/downloads  是個研究組織: http://lear.inrialpes.fr/  , 除此以外,還有一些源碼。
計算機視覺文獻與代碼資源

CVonline

http://homepages.inf.ed.ac.uk/rbf/CVonline

http://homepages.inf.ed.ac.uk/rbf/CVonline/unfolded.htm

http://homepages.inf.ed.ac.uk/rbf/CVonline/CVentry.htm



李子青的大做:

Markov Random Field Modeling in Computer Vision

http://www.cbsr.ia.ac.cn/users/szli/mrf_book/book.html

Handbook of Face Recognition (PDF)

http://www.umiacs.umd.edu/~shaohua/papers/zhou04hfr.pdf







張正友的有關參數魯棒估計著做:

Parameter Estimation Techniques:A Tutorial with Application to Conic Fitting

http://research.microsoft.com/~zhang/INRIA/Publis/Tutorial-Estim/Main.html



Andrea Fusiello「計算機視覺中的幾何」教程:Elements of Geometric Computer Vision

http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FUSIELLO4/tutorial.html#x1-520007





有關馬爾可夫蒙特卡羅方法的資料:

An introduction to Markov chain Monte Carlo

http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/SENEGAS/mcmc.html

Markov Chain Monte Carlo for Computer Vision--- A tutorial at ICCV05

http://civs.stat.ucla.edu/MCMC/MCMC_tutorial.htm



有關獨立成分分析(Independent Component Analysis , ICA)的資料:

An ICA-Page

http://www.cnl.salk.edu/~tony/ica.html

Fast ICA

http://www.cis.hut.fi/projects/ica/fastica/



The Kalman Filter (介紹卡爾曼濾波器的終極網頁)

http://www.cs.unc.edu/~welch/kalman/index.html



Cached k-d tree search for ICP algorithms

http://kos.informatik.uni-osnabrueck.de/download/3dim2007/paper.html





幾個計算機視覺研究工具

Machine Vision Toolbox for Matlab

http://www.petercorke.com/Machine%20Vision%20Toolbox.html



Matlab and Octave Function for Computer Vision and Image Processing

http://www.csse.uwa.edu.au/~pk/research/matlabfns/



Bayes Net Toolbox for Matlab

http://www.cs.ubc.ca/~murphyk/Software/BNT/bnt.html



OpenCV (Chinese)

http://www.opencv.org.cn/index.php/%E9%A6%96%E9%A1%B5



Gandalf (A Computer Vision and Numerical Algorithm Labrary)

http://gandalf-library.sourceforge.net/



CMU Computer Vision Home Page

http://www.cs.cmu.edu/afs/cs/project/cil/ftp/html/vision.html



Machine Learning Resource Links

http://www.cse.ust.hk/~ivor/resource.htm



The Bayesian Filtering Library

http://www.orocos.org/bfl



Optical Flow Algorithm Evaluation (提供了一個動態貝葉斯網絡框架,例如遞歸信息處理與分析、卡爾曼濾波、粒子濾波、序列蒙特卡羅方法等,C++寫的)

http://of-eval.sourceforge.net/



MATLAB code for ICP algorithm

http://www.usenet.com/newsgroups/comp.graphics.visualization/msg00102.html



牛人主頁:

朱鬆純(Song-Chun Zhu)

http://www.stat.ucla.edu/~sczhu/



David Lowe (SIFT) (很帥的一個老頭哦 ^ ^)

http://www.cs.ubc.ca/~lowe/



Andrea Vedaldi (SIFT)

http://vision.ucla.edu/~vedaldi/index.html



Pedro F. Felzenszwalb

http://people.cs.uchicago.edu/~pff/



Dougla Dlanman (Brown的一個研究生,在其主頁上搜集了大量算法教程和源碼)

http://mesh.brown.edu/dlanman/courses.html



Jianbo Shi (Ncuts 的始做俑者)

http://www.cis.upenn.edu/~jshi/



Active Vision Group (Oxford的一個機器視覺研究團隊,特點是SLAM,監視,導航)

http://www.robots.ox.ac.uk/ActiveVision/index.html



Juyang Weng(機器學習的專家,Autonomous Mental Development 是其特點)

http://www.cse.msu.edu/~weng/

測試圖片或視頻:

Middlebury College‘s Stereo Vision Data Set

http://cat.middlebury.edu/stereo/data.html





Intelligent Vehicle:

IVSource

www.ivsoruce.net

Robot Car

http://www.plyojump.com/robot_cars.html

How to Build a Robot: The Computer Vision Part

http://www.societyofrobots.com/programming_computer_vision_tutorial.shtml

計算機視覺應關注的資源
來自美國帝騰大學的連接。
Camera Calibration Links to toolboxes (mostly MATLAB)
for camera calibration.
Paul Debevec. Modeling and Rendering Architecture from Photographs.
Marc Pollefeys, Tutorial on 3D Modeling from Images,, ECCV 2000,


Available here: notes (12.1MB pdf)
Richard Szeliski NIPS 2004 Tutorial on Acquiring Detailed 3D Models From Images and Video,


Available here: slides (37.6 MB, ppt)
Peter Corke did his thesis work on visual servoing for robot applications and has authored a robotics toolkit
and vision toolkit for MATLAB.


local copy of thesis: Corke thesis (4.36 MB, pdf)

robot toolkit: robot.zip (568 KB, zip)

vision toolkit: mv.zip (1.08 MB, zip)
P. D. Kovesi., MATLAB
Functions for Computer Vision and Image Analysis.

School of Computer Science & Software Engineering, The University of Western Australia.

Available locally as a zip archive MatlabFns.zip (4.8 MB, updated 21 May 2005)
Philip Torr, among many other contributions, submitted a Structure and motion toolkit in Matlab to
the MathSoft File Exhange.

Local copy here: torrsam.zip (2.4 MB, zip).
本文引用地址: http://blog.sciencenet.cn/home.php?mod=space&uid=454498&do=blog&id=456240

posted @ 2012-04-18 15:45 Hanson-jun 閱讀(54) 評論(0)  編輯

描述子距離種類
1.hausdorff距離


  微分動力系統原理 這本書裏有介紹

  Hausdorff距離是描述兩組點集之間類似程度的一種量度,它是兩個點集之間距離的一種定義形式:假設有兩組集合A={a1,…,ap},B={b1,…,bq},則這兩個點集合之間的Hausdorff距離定義爲H(A,B)=max(h(A,B),h(B,A)) (1)

  其中,

  h(A,B)=max(a∈A)min(b∈B)‖a-b‖ (2)

  h(B,A)=max(b∈B)min(a∈A)‖b-a‖ (3)

  ‖·‖是點集A和B點集間的距離範式(如:L2或Euclidean距離).

  這裏,式(1)稱爲雙向Hausdorff距離,是Hausdorff距離的最基本形式;式(2)中的h(A,B)和h(B,A)分別稱爲從A集合到B集合和從B集合到A集合的單向Hausdorff距離.即h(A,B)實際上首先對點集A中的每一個點ai到距離此點ai最近的B集合中點bj之間的距離‖ai-bj‖進行排序,而後取該距離中的最大值做爲h(A,B)的值.h(B,A)同理可得.

  由式(1)知,雙向Hausdorff距離H(A,B)是單向距離h(A,B)和h(B,A)二者中的較大者,它度量了兩個點集間的最大不匹配程度

2.歐式距離



  歐幾里得距離定義: 歐幾里得距離( Euclidean distance)也稱歐式距離,它是一個一般採用的距離定義,它是在m維空間中兩個點之間的真實距離。

  在二維和三維空間中的歐式距離的就是兩點之間的距離,二維的公式是

  d = sqrt((x1-x2)^+(y1-y2)^)

  三維的公式是

  d=sqrt((x1-x2)^+(y1-y2)^+(z1-z2)^)

  推廣到n維空間,歐式距離的公式是

  d=sqrt( ∑(xi1-xi2)^ ) 這裏i=1,2..n

  xi1表示第一個點的第i維座標,xi2表示第二個點的第i維座標

  n維歐氏空間是一個點集,它的每一個點能夠表示爲(x(1),x(2),...x(n)),其中x(i)(i=1,2...n)是實數,稱爲x的第i個座標,兩個點x和y=(y(1),y(2)...y(n))之間的距離d(x,y)定義爲上面的公式.

  歐氏距離看做信號的類似程度。 距離越近就越類似,就越容易相互干擾,誤碼率就越高。

  所謂歐氏距離變換,是指對於一張二值圖像(再次咱們假定白色爲前景色,黑色爲背景色),將前景中的像素的值轉化爲該點到達最近的背景點的距離。

  歐氏距離變換在數字圖像處理中的應用範圍很普遍,尤爲對於圖像的骨架提取,是一個很好的參照。

  所謂歐氏距離變換,是指對於一張二值圖像(再次咱們假定白色爲前景色,黑色爲背景色),將前景中的像素的值轉化爲該點到達最近的背景點的距離。

  歐氏距離變換在數字圖像處理中的應用範圍很普遍,尤爲對於圖像的骨架提取,是一個很好的參照。

  ========

  歐氏距離:(∑(Xi-Yi)2)1/2,即兩項間的差是每一個變量值差的平方和再平方根,目的是計算其間的總體距離即不類似性。

  咱們熟悉的 歐氏距離雖然頗有用,但也有明顯的缺點。它將樣品的不一樣屬性(即各指標或各變量)之間的差異等同看待,這一點有時不能知足實際要求。例如,在教育研究中, 常常遇到對人的分析和判別,個體的不一樣屬性對於區分個體有着不一樣的重要性。所以,有時須要採用不一樣的距離函數。

3.馬氏距離:
馬氏距離是由 印度 統計學家馬哈拉諾比斯(P. C. Mahalanobis)提出的,表示數據的協方差距離。它是一種有效的計算兩個未知樣本集的類似度的方法。與 歐式距離 不一樣的是它考慮到各類特性之間的聯繫(例如:一條關於身高的信息會帶來一條關於體重的信息,由於二者是有關聯的)而且是尺度無關的(scale-invariant),即獨立於測量尺度。對於一個均值μ,爲 協方差矩陣 爲Σ的多變量向量,其馬氏距離爲((x-μ)'Σ^(-1)(x-μ))^(1/2)。

馬氏距離也能夠定義爲兩個服從同一分佈而且其協方差矩陣爲Σ的隨機變量與的差別程度:
  若是協方差矩陣爲單位矩陣,那麼馬氏距離就簡化爲歐式距離,若是協方差矩陣爲對角陣,則其也可稱爲正規化的歐氏距離'.
  其中σi 是 xi 的 標準差 .



馬氏優缺點:
  1)馬氏距離的計算是創建在整體樣本的基礎上的,這一點能夠從上述協方差矩陣的解釋中能夠得出,也就是說,若是拿一樣的兩個樣本,放入兩個不一樣的整體中,最後計算得出的兩個樣本間的馬氏距離一般是不相同的,除非這兩個整體的協方差矩陣碰巧相同;
  2)在計算馬氏距離過程當中,要求整體樣本數大於樣本的維數,不然獲得的整體樣本協方差矩陣逆矩陣不存在,這種狀況下,用歐式距離計算便可。
  3)還有一種狀況,知足了條件整體樣本數大於樣本的維數,可是協方差矩陣的逆矩陣仍然不存在,好比三個樣本點(3,4),(5,6)和(7,8),這種狀況是由於這三個樣本在其所處的二維空間平面內共線。這種狀況下,也採用歐式距離計算。
  4)在實際應用中「整體樣本數大於樣本的維數」這個條件是很容易知足的,而全部樣本點出現3)中所描述的狀況是不多出現的,因此在絕大多數狀況下,馬氏距離是能夠順利計算的,可是馬氏距離的計算是不穩定的,不穩定的來源是協方差矩陣,這也是馬氏距離與歐式距離的最大差別之處。
  優勢:它不受量綱的影響,兩點之間的馬氏距離與原始數據的測量單位無關;由標準化數據和中心化數據(即原始數據與均值之差)計算出的二點之間的馬氏距離相同。馬氏距離還能夠排除變量之間的相關性的干擾。缺點:它的缺點是誇大了變化微小的變量的做用。
  若是用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該知足以下四個條件:
  ①當且僅當i=j時,dij=0
  ②dij>0
  ③dij=dji(對稱性)
  ④dij≤dik+dkj(三角不等式)
  顯然,歐氏距離知足以上四個條件。知足以上條件的函數有多種,本節將要用到的馬氏距離也是其中的一種。
  第i個樣品與第j個樣品的馬氏距離dij用下式計算:
  dij =((x i 一x j)TS-1(x i一xj) )1/2(T、-一、1/2都是上標)
  其中,T表示轉置,x i 和x j分別爲第i個和第j個樣品的m個指標所組成的向量,S爲樣本協方差矩陣。



本文引用地址: http://blog.sciencenet.cn/home.php?mod=space&uid=261330&do=blog&id=526762

posted @ 2012-04-18 15:44 Hanson-jun 閱讀(40) 評論(0)  編輯

涉足計算機視覺領域要知道的

作機器視覺和圖像處理方面的研究工做,最重要的兩個問題:其一是要把握住國際上最前沿的內容;其二是所做工做要具有很高的實用背景。解決第一個問題的辦法就是找出這個方向公認最高成就的幾個超級專家(看看他們都在做什麼)和最權威的出版物(閱讀上面最新的文獻),解決第二個問題的辦法是你最好可以找到一個實際應用的項目,邊作邊寫文章。 作好這幾點的途徑之一就是利用網絡資源,利用權威網站和專家們的我的主頁。

依照下面目錄整理:

[1]研究羣體(國際國內)[2]專家主頁[3]前沿國際國內期刊與會議[4]搜索資源[5]GPL軟件資源

1、研究羣體

用來搜索國際知名計算機視覺研究組(CV Groups):

國際計算機視覺研究組清單 http://peipa.essex.ac.uk/info/groups.html

美國計算機視覺研究組清單  http://peipa.essex.ac.uk/info/groups.html#USA

http://www-2.cs.cmu.edu/~cil/vision.html 或  http://www.cs.cmu.edu/~cil/vision.html

這是卡奈基梅隆大學的計算機視覺研究組的主頁,上面提供很全的資料,從發表文章的下載到演示程序、測試圖像、經常使用連接、相關軟硬件,甚至還有一個搜索引擎。著名的有人物Tomasi, Kanade等。

卡內基梅隆大學雙目實驗室 http://vision.middlebury.edu/stereo/

卡內基梅隆研究組 http://www.cs.cmu.edu/~cil/v-groups.html

還有幾個實驗室:

Calibrated Imaging Laboratory 圖像

Digital Mapping Laboratory 映射

Interactive Systems Laboratory 互動

Vision and Autonomous Systems Center視覺自適應

http://www.via.cornell.edu/

康奈爾大學的計算機視覺和圖像分析研究組,好像是電子和計算機工程系的。側重醫學方面的研究,可是在上面有至關不錯資源,關鍵是它正在建設中,可以跟蹤一些信息。

Cornell University——Robotics and Vision group

http://www-cs-students.stanford.edu/  斯坦福大學計算機系主頁

1.  http://white.stanford.edu/

2.  http://vision.stanford.edu/

3.  http://ai.stanford.edu/ 美國斯坦福大學人工智能機器人實驗室

The Stanford AI Lab (SAIL) is the intellectual home for researchers in the Stanford Computer Science Department whose primary research focus is Artificial Intelligence. The lab is located in the Gates...

Vision and Imaging Science and Technology

http://www.fmrib.ox.ac.uk/analysis/

主要研究:Brain Extraction Tool, Nonlinear noise reduction, Linear Image Registration, Automated Segmentation, Structural brain change analysis, motion correction, etc.

http://www.cse.msu.edu/prip/ —密歇根州立大學計算機和電子工程系的模式識別--圖像處理研究組,它的FTP上有許多的文章(NEW)。

美國密歇根州大學認知模型和圖像處理實驗室

The Pattern Recognition and Image Processing (PRIP) Lab faculty and students investigate the use of machines to recognize patterns or objects. Methods are developed to sense objects, to discover which... http://www.cse.msu.edu/rgroups/prip/

http://pandora.inf.uni-jena.de/p/e/index.html

德國的一個數字圖像處理研究小組,在其上面能找到一些不錯的連接資源。

柏林大學  http://www.cv.tu-berlin.de/

德國波恩大學視覺和認識模型小組

Computer Vision Group located within the Division III of the Computer Science Department in the University of Bonn in Germany. This server offers information on topics concerning our computer vision  http://www-dbv.informatik.uni-bonn.de/

http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html

CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture.

http://cfia.gmu.edu/

The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links between academic institutes, industry and government agencies, and to transfer key technologies to help
industry build next generation commercial and military imaging and multimedia systems.

英國的Bristol大學的Digital Media Group在高級圖形圖像方面不錯。主要就是涉及到場景中光線計算的問題,好比用全局光照或是各類局部光照對高動態圖的處理,還有近似真實的模擬現實環境 (照片級別的),還有用幾張照片來創建3D模型(人頭之類的)。另外也有對古代建築模型復原。 http://www.cs.bristol.ac.uk/Research/Digitalmedia/

並且根據Times全英計算機排名在第3, 也算比較頂尖的研究了

http://www.cmis.csiro.au/IAP/zimage.htm

這是一個側重圖像分析的站點,通常。可是提供一個Image Analysis環境---ZIMAGE and SZIMAGE。

麻省理工視覺實驗室MIT  http://groups.csail.mit.edu/vision/welcome/

AI Laboratory Computer Vision group

Center for Biological and Computational Learning

Media Laboratory, Vision and Modeling Group

Perceptual Science group

UC Berkeley  http://0-vision.berkeley.edu.ilstest.lib.neu.edu/vsp/index.html

http://www.cs.berkeley.edu.ilste ... n/vision_group.html

加州大學伯克利分校視覺實驗室David A. Forsyth: http://www.cs.berkeley.edu/~daf/

UCLA(加州大學洛杉磯分校)  http://vision.ucla.edu/ 視覺實驗室

英國牛津的A.Zisserman: http://www.robots.ox.ac.uk/~az/  機器人實驗室

美國南加州大學智能機器人和智能系統研究所University of Southern California, Los Angeles

IRIS is an interdepartmental unit of USC's School of Engineering with ties to USC's Information Sciences Institute (ISI). Members include faculty, graduate students, and research staff associated with...  http://iris.usc.edu/  Computer
Vision 實驗室

美國南加州大學計算機視覺實驗室介紹:

Computer Vision Laboratory at the University of Southern California is one of the major centers of computer vision research for thirty years. they conduct research in a number of basic and applied are... http://iris.usc.edu/USC-Computer-Vision.html

英國約克大學高級計算機結構神經網絡小組

The Advanced Computer Architecture Group has had a thriving research programme in neural networks for over 10 years. The 15 researchers, led by Jim Austin, focus their work in the theory and applicati... http://www.cs.york.ac.uk/arch/neural/

瑞士戴爾莫爾感知人工智能研究所

IDIAP is a research institute established in Martigny in the Swiss Alps since 1991. Active in the areas of multimodal interaction and multimedia information management, the institute is also the leade... http://www.idiap.ch/

英國薩里大學視覺,語言和信號處理中心

The Centre for Vision, Speech and Signal Processing (CVSSP) is more than 60 members strong, comprising 12 academic staff, 18 research fellows and more than 44 research students. The activities of the ... http://www.ee.surrey.ac.uk/Research/VSSP/

美國阿默斯特馬薩諸塞州立大學計算機視覺實驗室

The Computer Vision Laboratory was established in the Computer Science Department at the University of Massachusetts in 1974 with the goal of investigating the scientific principles underlying the con... http://vis-www.cs.umass.edu

University of Massachusetts——Computer Vision Laboratory for Perceptual Robotics

美國芝加哥伊利諾伊斯大學貝克曼研究中心智能機器人和計算機視覺實驗室

Includes the following groups: Professor Seth Hutchinson's Research Group Professor David Kriegman's Research Group Professor Jean Ponce's Research Group Professor Narendra Ahuja's Research Gro... http://www-cvr.ai.uiuc.edu/

Computer Vision and Robotics Laboratory

Vision Interfaces and Systems Laboratory (VISLab)

英國伯明翰大學計算機科學學校視覺研究小組

The vision group at the School of Computer Science (a RAE 5 rated department) performs research into a wide variety of computer vision and image understanding areas. Much of this work is performed in ... http://www.cs.bham.ac.uk/research/vision/

微軟研究院機器學習與理解研究小組 / 計算機視覺小組

The research group focuses on the development of more advanced and intelligent computer systems through the exploitation of statistical methods in machine learning and computer vision. The site lists ... http://research.microsoft.com/mlp/

http://research.microsoft.com/en-us/groups/vision/

微軟公司的文獻: http://research.microsoft.com/research/pubs

微軟亞洲研究院: http://research.microsoft.com/asia/ ,值得關注Harry Shum, Jian Sun, Steven Lin, Long Quan(兼職HKUST)etc.

瑞典隆德大學數學系視覺組: http://www.maths.lth.se/matematiklth/personal/andersp/

感受國外搞視覺的好可能是數學系出身,大約作計算機視覺對數學要求很高吧。

澳大利亞國立大學: http://users.rsise.anu.edu.au/~hartley/

美國北卡大學: http://www.cs.unc.edu/~marc/

法國INRIA: http://www-sop.inria.fr/odyssee/team/  由Olivier.Faugeras領銜的牛人衆多。

比利時魯汶大學的L.Van Gool:  www.esat.kuleuven.ac.be/psi/visics/

聽說在這個只有中國一個小鎮大小的地方的魯汶大學在歐洲排行top10,名列世界top100,還出了幾個諾貝爾獎,視覺研究也很強.

美國明德 http://vision.middlebury.edu/stereo/

如下含有非頂尖美國學校研究組,沒有連接(個別的上面已經提到),供參考。

Amerinex Applied Imaging, Inc.

Boston University

Image and Video Computing Research group

University of California at Santa Barbara加州大學芭芭拉分校

Vision Research Lab

University of California at San Diego加州大學聖迭戈分校

Computer Vision & Robotics Research Laboratory

Visual Computing laboratory

University of California at Irvine加州大學歐文分校,加州南部一城,在聖安娜東南,

Computer Vision laboratory

University of California, Riverside加州大學河濱分校

Visualization and Intelligent Systems Laboratory (VISLab)

University of California at Santa Cruz

Perceptual Science Laboratory

Caltech (加州理工)

Vision group

University of Central Florida

Computer Vision laboratory

University of Florida

Center for Computer Vision and Visualization

Colorado State University

Computer Vision group

Columbia University

Automated Vision Environment (CAVE)

Robotics group

University of Georgia, Athens

Visual and Parallel Computing Laboratory

Harvard University(哈佛)

Robotics Laboratory

University of Illinois at Urbana-Champaign

Robotics and Computer Vision

University of Iowa

Division of Physiologic Imaging

Jet Propulsion Laboratory

Machine Vision and Tracking Sensors group

Khoral Research, Inc

Lawrence Berkeley Laboratories

Imaging and Collaborative Computing Group

Imaging and Distributed Computing

Lehigh University

Image Processing and Pattern Analysis Lab

Vision And Software Technology Laboratory

University of Louisville

Computer Vision and Image Processing Lab

University of Maryland

Computer Vision Laboratory

University of Miami

Underwater Vision and Imaging Laboratory

University of Michigan密歇根

AI Laboratory

Michigan State University 密歇根州立

Pattern Recognition and Image Processing laboratory

Environmental Research Institute of Michigan (ERIM) 密歇根大學有汽車車身檢測研究

University of Missouri-Columbia

Computational Intelligence Research Laboratory

NEC

Computer Vision and Image Processing

University of Nevada

Computer Vision Laboratory

Notre-Dame University

Vision-Based Robotics using Estimation

Ohio State University

Signal Analysis and Machine Perception Laboratory

University of Pennsylvania

GRASP laboratory

Medical Image Processing group

Vision Analysis and Simulation Technologies (VAST) Laboratory

Penn State University 賓夕法尼亞大學

Computer Vision

Precision Digital Images

Purdue University普渡大學

Robot Vision laboratory

Video and Image Processing Laboratory (VIPER)

Rensselaer Polytechnic Institute (RPI)

Computer Science Vision

University of Rochester

Center for Electronic Imaging Systems

Vision and Robotics laboratory

Rutgers University (The State University of New Jersey)

Image Understanding Lab

University of Southern California

Computer Vision

University of South Florida

Image Analysis Research group

Stanford Research Institute International (SRI)

RADIUS -- Research and Development for Image Understanding Systems

The Perception program at SRI's AI Center

SUNY at Stony Brook

Computer Vision Lab

University of Tennessee

Imaging, Robotics and Intelligent Systems laboratory

University of Texas, Austin

Laboratory for Vision Systems

University of Utah

Center for Scientific Computing and Imaging

Robotics and Computer Vision

University of Virginia

Computer Vision Research (CS)

University of Washington

Image Computing Systems Laboratory

Information Processing Laboratory

CVIA Laboratory

University of West Florida

Image Analysis/Robotics Research Laboratory

University of Wisconsin

Computer Vision group

Vanderbilt University

Center for Intelligent Systems

Washington State University

Imaging Research laboratory

Wright-Patterson

Model-Based Vision laboratory

Wright State University

Intelligent Systems Laboratory

University of Wyoming

Wyoming Image and Signal Processing Research (WISPR)

Yale University

Computational Vision Group  http://www.cs.yale.edu/

School of Medicine, Image Processing and Analysis group

國內:

中科院模式識別國家重點實驗室  http://www.nlpr.ia.ac.cn/English/rv/mainpage.html

虹膜識別、掌紋識別、人臉識別、

蓮花山 http://www.stat.ucla.edu/~sczhu/Lotus/

天津大學精密測試技術及儀器國家重點實驗室

研究方向包括:激光及光電測試技術、傳感及測量信息技術、微納測試與製造技術、製造質量控制技術。該實驗室是國內精密測試領域唯一的國家重點實驗室。

「智能微系統及其集成應用技術」、「微結構光學測試技術」、「油氣儲運安全檢測技術」、「先進製造中的視覺測量及其關鍵技術」、「正交偏振激光器原理、特性及其在精密計量中的應用研究」等5項表明性成果(07.3)。

中科院長春光機所  http://www.ciomp.ac.cn/ny/keyan.asp

中科院瀋陽自動化所 http://www.sia.ac.cn/index.php

中科院西安光機所 http://www.opt.ac.cn/yanjiushi/gpcxjs1.htm

北京大學智能科學系 http://www.cis.pku.edu.cn/vision/vision.htm

三維視覺計算與機器人,生物特徵識別與圖像識別

2、專家網頁

http://www.ai.mit.edu/people/wtf/

這位但是MIT人工智能實驗室的BILL FREEMAN。專長是:理解--貝葉斯模型。

http://www.merl.com/people/brand/

MERL(Mitsubishi Electric Research Laboratory)中的擅長「Style Machine」。

http://research.microsoft.com/~ablake/

CV界極有聲望的A.Blake 1977年畢業於劍橋大學三一學院並或數學與電子科學學士學位。以後在MIT,Edinburgh,Oxford前後組建過研究小組併成爲Oxford的教授,直到1999年進入微軟劍橋研究中心。主要工做領域是計算機視覺。

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html

這位專家好像正在學習漢語,主頁而且蒐集了諸如「兩隻老虎(Two Tigers)」的歌曲。

他的主頁上面還有幾個專家:Shumeet Baluja, Takeo Kanade。他們的Face Detection做的絕對是世界一流。畢業於卡奈基梅隆大學的計算機科學系,興趣是計算機視覺。

3、前沿國際國內期刊與會議

這裏的期刊大部分均可以經過上面的專家們的主頁間接找到

1.國際會議 2.國際期刊 3.國內期刊 4.神經網絡 5.CV 6.數字圖象 7.教育資源,大學 8.常見問題

1. 國際會議

如今,國際上計算機視覺方面的三大國際會議是ICCV, CVPR和ECCV,統稱之爲ICE。

ICCV的全稱是International Comference on Computer Vision。ICCV兩年一次,與ECCV正好錯開,是公認的三個會議中級別最高的。

ECCV的全稱是Europeon Conference on Computer Vision,是一個歐洲的會議。

CVPR的全稱是Internaltional Conference on Computer Vision and Pattern Recogintion國際計算機視覺與模式識別會議。這是一個一年一次的會議,舉辦地在美國。

ICIP—

BMVC—

MVA—

國際模式識別會議(ICPR ):

亞洲計算機視覺會議(ACCV):

2.國際期刊

以計算機視覺爲主要內容之一的國際刊物也有不少,如:

International Journal of Computer Vision

IEEE Trans. On PAMI  http://www.computer.org/tpami/index.htm

IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm

Pattern Recognition  http://www.elsevier.com/locate/issn/00313203

Pattern Recognition Letters  http://www.elsevier.com/locate/issn/01678655

IEEE Trans. on Robotics and Automation,

IEEE TPAMI

IEEE TIP

CVGIP Computer Vision. Graphics and Image Processing,

Visual Image Computing,

IJPRAI(Internatiorial Journat of Pattern Recognition and Artificial Intelligence)

衆所周知, computer vision(cv) 存在ICCV/CVPR/ECCV三個頂級會議,它們檔次差很少,都應該在一流會議行列, 沒有必要給個高下。有些us的人認爲ICCV/CVPR略好於ECCV,而歐洲人大都認爲ICCV/ECCV略好於CVPR,某些英國的人甚至認爲BMVC好於CVPR。簡言之, 三個會議差很少, 各有側重和偏好。

筆者就我的經驗淺談三會異同, 以供你們參考和討論。 三者乃cv領域的旗艦和風向標,其oral paper (包括best paper) 表明當年度cv的最高水準, 在此引用Harry Shum的一句話, 想知道某個領域在作些什麼,找最近幾年此領域的proceeding看看就知道了。 ICCV/CVPR由IEEE Computer Society牽頭組織, ECCV好像沒有專門負責的組織。 CVPR每一年(除2002年)都在美國開, ECCV每兩年開一次,僅限歐洲, ICCV也是每兩年一次,各洲輪值。 基本能夠保證每一年有兩個會議開,
這樣研究者就有兩次躋身牛會的機會。

就錄取率而言, 三會都有波動。 如ICCV2001錄取率>30%,且出現兩我的(華人)各有三篇第一做者的paper的狀況, 這在頂級牛會是不常見的 (灌水嫌疑)。 可是, ICCV2003, 2005兩次錄取率都很低, 大約20%左右。 ECCV也是相似規律, 在2004年之前都是>30%, 2006年下降到20%左右。 CVPR的錄取率近年來一直偏高,從2004年開始一直都在[25%,30%]。最近一次CVPR2006是28.1%, CVPR2007還不知道統計數據。筆者猜想爲了維持錄取paper的絕對數量,
當submission少的時候錄取率偏高, 反之偏低,近幾年三大會議的投稿數量所有超過1000, 相對2000年前, 三會錄取率均大幅度下降,最大幅度50%->20%。 對錄取率走勢感興趣的朋友, 可參考  http://vrlab.epfl.ch/~ulicny/statistics/(CVPR2004 的數據是錯的), http://www.adaptivebox.net/research/bookmark/CICON_stat.html.

顯然, 投入cv的人愈來愈多,這個領域也是愈來愈大, 這點頗不似machine learning一直奉行愚蠢的小圈子主義。另一點值得注意, ICCV/ECCV只收vision相關的topic,而cvpr會收少許的pattern recognition paper, 如finger print等,可是不收和image/video徹底不佔邊的pr paper,如speech recognition等。我一個朋友曾經review過一篇投往CVPR的speech的paper, 三個reviewer一致拒絕,其中一個reviewer搞笑的指出,
你這篇paper應該是投ICASSP被據而轉投CVPR的。 就topic而言, CVPR涵蓋最廣。 還有一個沒有驗證過的緣由致使CVPR錄取率高: 不少us的researcher不肯意或沒有足夠的經費到us之外的地方開會, 故CVPR會優先接收不少來自us的paper (讓你們都happy)。

以上對三會的分析對咱們投paper是頗有指導做用的。 目前的research我想絕大部分仍是紙上談兵, 必經 read paper -> write paper -> publish paper -> publish paper on top conferences and journals流程。故瞭解投paper的一些基本技巧, 掌握領域的走向和熱點, 是很是必要的。 避免作無用功,選擇切合的topic,改善presentation, 注意格式 (遵照規定的模板), 我想這是不少新手須要注意的問題。如ICCV2007明文規定不寫summary
page直接reject, 可是仍然有人忽視, 這是至關不值得的。

3.國內期刊

自動化學報、計算機學報、軟件學報、電子學報,中國圖象圖形學報,模式識別與人工智能,光電子激光,精密光學工程等。

4.神經網絡

神經網絡-Neural Networks Tutorial Review

http://hem.hj.se/~de96klda/NeuralNetworks.htm

ftp://ftp.sas.com/pub/neural/FAQ.html

Image Compression with Neural Networks

http://www.comp.glam.ac.uk/digimaging/neural.htm

Backpropagator's Review

http://www.dontveter.com/bpr/bpr.html

Bibliographies on Neural Networks

http://liinwww.ira.uka.de/bibliography/Neural/

Intelligent Motion Control with an Artificial Cerebellum

http://www.q12.org/phd.html

Kernel Machines

http://www.kernel-machines.org/

Some Neural Networks Research Organizations

http://www.ieee.org/nnc/

http://www.inns.org/

Neural Network Modeling in Vision Research

http://www.rybak-et-al.net/nisms.html

Neural Networks and Machine Learning

http://learning.cs.toronto.edu/

Neural Application Software

http://attrasoft.com

Neural Network Toolbox for MATLAB

http://www.mathworks.com/products/neuralnet/

Netlab Software

http://www.ncrg.aston.ac.uk/netlab/

Kunama Systems Limited  http://www.kunama.co.uk/

5.Computer Vision(計算機視覺)

Annotated Computer Vision Bibliography

http://iris.usc.edu/Vision-Notes/bibliography/contents.html

http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html

Lawrence Berkeley National Lab Computer Vision and Robotics Applications

http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html

CVonline by University of Edinburgh

The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision,  www.dai.ed.ac.uk/CVonline

Computer Vision Handbook,

www.cs.hmc.edu/~fleck/computer-vision-handbook

Vision Systems Courseware

www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html

Research Activities in Computer Vision

http://www-syntim.inria.fr/syntim/analyse/index-eng.html

Vision Systems Acronyms

www.vision-systems-design.com/vsd/archive/acronyms.html

Dictionary of Terms in Human and Animal Vision

http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html

Metrology based on Computer Vision

www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html

6.Digital Photography 數字圖像

Digital Photography, Scanning, and Image Processing

www.dbusch.com/scanners/scanners.htm  l

7.Educational Resources, Universities 教育資源,大學

Center for Image Processing in Education

www.cipe.com

Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology

http://wally2.rit.edu/pubs/guides/imagingcall.html

Mathematical Experiences through Image Processing, University of Washington

www.cs.washington.edu/research/metip/metip.html

Vismod Tech Reports and Publications, MIT

http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker

Vision Lab PhD dissertation list, University of Antwerp

http://wcc.ruca.ua.ac.be/~visielab/theses.html

INRIA (France) Research Projects: Human-Computer Interaction, Image Processing, Data Management, Knowledge Systems

www.inria.fr/Themes/Theme3-eng.html

Image Processing Resources

http://eleceng.ukc.ac.uk/~rls3/Contents.htm

Publications of Carsten Steger

http://www9.informatik.tu-muench ... r/publications.html

8.FAQs(常見問題)

comp.dsp FAQ

www.bdti.com/faq/dsp_faq.htm

Robotics FAQ

www.frc.ri.cmu.edu/robotics-faq

Where's the sci.image.processing FAQ?

www.cc.iastate.edu/olc_answers/p ... processing.faq.html

comp.graphics.algorithms FAQ, Section 3, 2D Image/Pixel Computations

www.exaflop.org/docs/cgafaq

Astronomical Image Processing System FAQ

www.cv.nrao.edu/aips/aips_faq.html

4、搜索資源

http://sal.kachinatech.com/

http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml  北京大學

Google輸入:computer vision 或computer vision groups能夠得到不少結果

網絡資源:

CVonline  http://homepages.inf.ed.ac.uk/rbf/CVonline/ 視覺研究組列表

Computer vision test Image  http://www.cs.cmu.edu/~cil/v-images.html 卡內基梅隆標準圖片庫

視覺論文搜索:Paper search

http://www.researchindex.com

5、圖像處理GPL庫(代碼庫圖像庫等)

http://www.ph.tn.tudelft.nl/~klamer/cppima.html

Cppima 是一個圖像處理的C++函數庫。這裏有一個較全面介紹它的庫函數的文檔,固然你也能夠下載壓縮的GZIP包,裏面包含TexInfo格式的文檔。

http://iraf.noao.edu/

Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software system for the reduction and analysis of astronomical data

http://entropy.brni-jhu.org/tnimage.html

一個很是不錯的Unix系統的圖像處理工具,看看它的截圖。你能夠在此基礎上構建本身的專用圖像處理工具包。

http://sourceforge.net/projects/

這是GPL軟件集散地,能夠搜索IP庫。

國內的CSDN  http://www.csdn.net/
相關文章
相關標籤/搜索