壓縮感知是近年來極爲熱門的研究前沿,在若干應用領域中都引發矚目。關於這個題目,松鼠會已經翻譯了兩篇文章,一篇來自於壓縮感知技術最初的研究者陶哲軒(連接),一篇來自威斯康辛大學的數學家艾倫伯格(本文正文)。這兩篇文章都是普及性的,可是因爲做者是專業的研究人員,因此事實上行文仍然偏於晦澀。所以我不揣冒昧,在這裏附上一個多此一舉的導讀,以幫助更多的讀者更好了解這個新穎的研究領域在理論和實踐上的意義。 html
壓縮感知從字面上看起來,好像是數據壓縮的意思,而實則出於徹底不一樣的考慮。經典的數據壓縮技術,不管是音頻壓縮(例如 mp3),圖像壓縮(例如 jpeg),視頻壓縮(mpeg),仍是通常的編碼壓縮(zip),都是從數據自己的特性出發,尋找並剔除數據中隱含的冗餘度,從而達到壓縮的目的。這樣的壓縮有兩個特色:第1、它是發生在數據已經被完整採集到以後;第2、它自己須要複雜的算法來完成。相較而言,解碼過程反而通常來講在計算上比較簡單,以音頻壓縮爲例,壓制一個 mp3 文件的計算量遠大於播放(即解壓縮)一個 mp3 文件的計算量。 算法
稍加思量就會發現,這種壓縮和解壓縮的不對稱性正好同人們的需求是相反的。在大多數狀況下,採集並處理數據的設備,每每是廉價、省電、計算能力較低的便攜設備,例如傻瓜相機、或者錄音筆、或者遙控監視器等等。而負責處理(即解壓縮)信息的過程卻反而每每在大型計算機上進行,它有更高的計算能力,也經常沒有便攜和省電的要求。也就是說,咱們是在用廉價節能的設備來處理複雜的計算任務,而用大型高效的設備處理相對簡單的計算任務。這一矛盾在某些狀況下甚至會更爲尖銳,例如在野外做業或者軍事做業的場合,採集數據的設備每每曝露在天然環境之中,隨時可能失去能源供給或者甚至部分喪失性能,在這種狀況下,傳統的數據採集-壓縮-傳輸-解壓縮的模式就基本上失效了。 性能
壓縮感知的概念就是爲了解決這樣的矛盾而產生的。既然採集數據以後反正要壓縮掉其中的冗餘度,而這個壓縮過程又相對來講比較困難,那麼咱們爲何不直接「採集」壓縮後的數據?這樣採集的任務要輕得多,並且還省去了壓縮的麻煩。這就是所謂的「壓縮感知」,也就是說,直接感知壓縮了的信息。 優化
但是這看起來是不可能的事情。由於壓縮後的數據並非壓縮前的數據的一個子集,並非說,原本有照相機的感光器上有一千萬個像素,扔掉其中八百萬個,剩下的兩百萬個採集到的就是壓縮後的圖像,──這樣只能採集到不完整的一小塊圖像,有些信息被永遠的丟失了並且不可能被恢復。若是要想採集不多一部分數據而且期望從這些少許數據中「解壓縮」出大量信息,就須要保證:第一:這些少許的採集到的數據包含了原信號的全局信息,第二:存在一種算法可以從這些少許的數據中還原出原先的信息來。 ui
有趣的是,在某些特定的場合,上述第一件事情是自動獲得知足的。最典型的例子就是醫學圖像成像,例如斷層掃描(CT)技術和核磁共振(MRI)技術。對這兩種技術稍有了解的人都知道,這兩種成像技術中,儀器所採集到的都不是直接的圖像像素,而是圖像經歷過全局傅立葉變換後的數據。也就是說,每個單獨的數據都在某種程度上包含了全圖像的信息。在這種狀況下,去掉一部分採集到的數據並不會致使一部分圖像信息永久的丟失(它們仍舊被包含在其它數據裏)。這正是咱們想要的狀況。 編碼
上述第二件事就要歸功於陶哲軒和坎戴的工做了。他們的工做指出,若是假定信號(不管是圖像仍是聲音仍是其餘別的種類的信號)知足某種特定的「稀疏性」,那麼從這些少許的測量數據中,確實有可能還原出原始的較大的信號來,其中所須要的計算部分是一個複雜的迭代優化過程,即所謂的「L1-最小化」算法。 spa
把上述兩件事情放在一塊兒,咱們就能看到這種模式的優勢所在。它意味着:咱們能夠在採集數據的時候只簡單採集一部分數據(「壓縮感知」),而後把複雜的部分交給數據還原的這一端來作,正好匹配了咱們指望的格局。在醫學圖像領域裏,這個方案特別有好處,由於採集數據的過程每每是對病人帶來很大麻煩甚至身體傷害的過程。以 X 光斷層掃描爲例,衆所周知 X 光輻射會對病人形成身體損害,而「壓縮感知」就意味着咱們能夠用比經典方法少得多的輻射劑量來進行數據採集,這在醫學上的意義是不言而喻的。 .net
這一思路能夠擴展到不少領域。在大量的實際問題中,咱們傾向於儘可能少地採集數據,或者因爲客觀條件所限不得不採集不完整的數據。若是這些數據和咱們所但願重建的信息之間有某種全局性的變換關係,而且咱們預先知道那些信息知足某種稀疏性條件,就總能夠試着用相似的方式從比較少的數據中還原出比較多的信號來。到今天爲止,這樣的研究已經拓展地很是普遍了。
可是一樣須要說明的是,這樣的作法在不一樣的應用領域裏並不總能知足上面所描述的兩個條件。有的時候,第一個條件(也就是說測量到的數據包含信號的全局信息)沒法獲得知足,例如最傳統的攝影問題,每一個感光元件所感知到的都只是一小塊圖像而不是什麼全局信息,這是由照相機的物理性質決定的。爲了解決這個問題,美國 Rice 大學的一部分科學家正在試圖開發一種新的攝影裝置(被稱爲「單像素照相機」),爭取用盡可能少的感光元件實現儘可能高分辨率的攝影。有的時候,第二個條件(也就是說有數學方法保證可以從不完整的數據中還原出信號)沒法獲得知足。這種時候,實踐就走在了理論前面。人們已經能夠在算法上事先不少數據重建的過程,可是相應的理論分析卻成爲了留在數學家面前的課題。 翻譯
可是不管如何,壓縮感知所表明的基本思路:從儘可能少的數據中提取儘可能多的信息,毫無疑問是一種有着極大理論和應用前景的想法。它是傳統信息論的一個延伸,可是又超越了傳統的壓縮理論,成爲了一門嶄新的子分支。它從誕生之日起到如今不過五年時間,其影響卻已經席捲了大半個應用科學。 視頻