前言: 就在昨天,人類歷史上第一張黑洞圖像被「拍」出來了。算法
請配戴眼鏡查看高清大圖機器學習
儘管黑洞的第一張真身照是一張模糊、不規則的圓環,但這張照片的背後凝結了目前最早進的探測技術,整個過程歷時十餘年,動用了來自非洲、亞洲、歐洲、北美洲和南美洲的200多名研究人員,八個探測望遠鏡不分晝夜觀測,最終的這張圖像也有可能得到諾貝爾獎。學習
這一切成就,都離不開視界望遠鏡和背後的計算。設計
人類「拍」到的第一張黑洞照片,並非像咱們拿手機拍照那樣,點下屏幕就好,而是須要分佈在全球各地的許多天文望遠鏡在同一時間「按下快門」,記錄無線電數據。3d
而後,再依靠機器學習算法,把數據拼到一塊兒,重建出圖像。cdn
圖片的造成過程:對象
其實拍攝這些圖片來自智利、夏威夷、南極洲、亞利桑那、西班牙、墨西哥六個地方的一共八臺天文望遠鏡。天文望遠鏡獲取的數據量很是大,然而這些數據裏面不只僅包含黑洞,還包含天空中的各類複雜、凌亂的數據,科學家們要靠這些數據,拼出一張完整的黑洞寫真。blog
2017年4月5日,由位於南極、智利、墨西哥、美國夏威夷、美國亞利桑那州、西班牙的8臺亞毫米射電望遠鏡同時對黑洞展開觀測,利用甚長基線干涉測量技術(VLBI)將這8臺望遠鏡構建成超級「虛擬」望遠鏡——視界面望遠鏡(EHT),EHT口徑13000千米,約等同於地球直徑。圖片
處理照片:數學
其實,天文望遠鏡早就拍完了照片,而「洗照片」的過程長達兩年。爲何「洗照片」時間如此之長?
由於這類觀測的數據處理並不是只用一套現成的方法。多臺望遠鏡之間的鐘差、望遠鏡自身狀態隨時間的微小改變等問題都會影響觀測精度。另外一方面,「拍照」對象黑洞自己也在不斷變化,科學家須要探索新方法對「相機」進行校準,創建模型,以提高合成圖像的質量和精度。
原本,根據天文望遠鏡數據還原天體圖像,用成像算法便可。
然而面對PB級稀疏、嘈雜的數據,想靠人力從中找出圖像太難了。因而,科學家們使用了機器學習方法。
圖像處理常常被處理成反問題,什麼是反問題:
考慮正問題f=Au+n,n是觀測噪聲,反問題就是在有了觀測f的條件下怎麼得到真實圖片u
若是A是一個恆同算子,反問題就是去燥
若是A是一個模糊,反問題就是去模糊
若是A是一個CT,反問題就是CT恢復
在將算法以前說一下這個問題意義,打個比方你要作核磁共振,你要綁在牀上聽着快一個小時噪聲,那麼你就但願A這個算法進行sample 次數變少,那麼若是我算法更厲害,你mri時間會越少。
有人說,這個問題簡單
就行了,那麼若是A不可逆呢? 你說這個也簡單,最小二乘啊
,那麼你就是沒有考慮到n--觀測噪聲
考慮一個去模糊問題,若是有噪聲,直接求逆結果會是怎麼樣的呢?
噪聲在求逆的時候無數倍的被放大了,產生了棋盤同樣的artifact 那麼怎麼解決問題呢?加入正則項!
這裏的R的做用時 若是u不是「圖片」,那麼R值大一點 若是u像一張圖片,R的值小一點 數學家就花了好久來構造R,第一個成功的是total variation,定義爲
那麼咱們用到的這個算法是什麼樣的呢: 對於simulate數據
用了total variation的效果是
爲何呢,爲了達到這個分辨尺度,根據測不許原理,他們須要整個地球半徑的天文望遠鏡。可是事實上咱們造不出來這麼大的望遠鏡,只能用九個觀測站點的數據來作。這是一個高度不適定的反問題,那麼須要更好的正則項。 設計正則項他們用到的想法是學習
From Learning Models of Natural Image Patches to Whole Image Restoration
他們用高斯混合模型對圖片patch進行建模,學習出圖片patch的distribution做爲上面問題的正則項。
ted talk裏面還將到他們用了多個數據集去學習,用平常圖片,宇宙照片,望遠鏡數據。。學習出來了不少個正則項,發現恢復出來的圖片都是這樣的圖片。
其實看到這裏,咱們已是很震驚了,原來霍金的黑洞論真實存在,咱們人類還宇宙面前真的很眇小。可是隨着科技的不斷髮展,咱們人類也會認識更加深刻的宇宙。